在Polars中,我可以获得水平最大值(到达行的一组列的最大值),如下所示:
df = pl.DataFrame(
{
"a": [1, 8, 3],
"b": [4, 5, None],
}
)
df.with_columns(max = pl.max_horizontal("a", "b"))
┌─────┬──────┬─────┐
│ a ┆ b ┆ max │
│ --- ┆ --- ┆ --- │
│ i64 ┆ i64 ┆ i64 │
╞═════╪══════╪═════╡
│ 1 ┆ 4 ┆ 4 │
│ 8 ┆ 5 ┆ 8 │
│ 3 ┆ null ┆ 3 │
└─────┴──────┴─────┘
这相当于Pandas df[["a", "b"]].max(axis=1)
.
现在,如何获得列名而不是实际的最大值?
换句话说,Pandas df[CHANGE_COLS].idxmax(axis=1)
的极地版本是什么?
预期输出为:
┌─────┬──────┬─────┐
│ a ┆ b ┆ max │
│ --- ┆ --- ┆ --- │
│ i64 ┆ i64 ┆ str │
╞═════╪══════╪═════╡
│ 1 ┆ 4 ┆ b │
│ 8 ┆ 5 ┆ a │
│ 3 ┆ null ┆ a │
└─────┴──────┴─────┘