我正在使用一个深度嵌套的DataFrame(我知道这不是一个好的实践),我想表达类似于"为列表Y中的所有 struct Select 字段X"的意思.
数据 struct 的一个例子:
import polars as pl
data = {
"a": [
[{
"x": [1, 2, 3],
"y": [4, 5, 6]
},
{
"x": [2, 3, 4],
"y": [3, 4, 5]
}
]
],
}
df = pl.DataFrame(data)
在本例中,我想在两个 struct 中 Select 字段"x",并将它们聚集成一个带有两个系列的df,分别称为"x_1"和"x_2".
换句话说,期望输出是:
┌───────────┬───────────┐
│ x_1 ┆ x_2 │
│ --- ┆ --- │
│ list[i64] ┆ list[i64] │
╞═══════════╪═══════════╡
│ [1, 2, 3] ┆ [2, 3, 4] │
└───────────┴───────────┘
我不知道列表的长度提前,我希望动态地执行这个任务(即不对字段名称进行硬编码).我不确定这是否可能使用Polars表达式?
提前感谢!