Python 极轴：通过创建多个新列对列进行操作

发布于02月14日

data = {"col1": ['2020/01/01', '2020/02/01'], "col2": ['2020/01/01', '2020/02/01']}
df = pl.DataFrame(data, schema={"col1": pl.Utf8, "col2": pl.Utf8})

df = df.with_columns(
    pl.col('col1').str.to_datetime(),
    pl.col('col2').str.to_datetime()
)

df.with_columns(
    pl.col(pl.DATETIME_DTYPES).dt.year()
)

使用给定的代码，我想用提取的年份为pl.DATETIME_DTYPES Select 的每一列创建新列.对于单个列，我会应用.alias()，但对于可能的102个新列，该怎么办呢？有generic种方法吗？

推荐答案

为此，您可以使用pl.Expr.name命名空间中的方法.最灵活的方法是pl.Expr.name.map，但也有pl.Expr.name.prefix、pl.Expr.name.suffix等.

df.with_columns(
    pl.col(pl.DATETIME_DTYPES).dt.year().name.map(lambda s: s + "_year")
)

Output.个

shape: (2, 4)
┌─────────────────────┬─────────────────────┬───────────┬───────────┐
│ col1                ┆ col2                ┆ col1_year ┆ col2_year │
│ ---                 ┆ ---                 ┆ ---       ┆ ---       │
│ datetime[μs]        ┆ datetime[μs]        ┆ i32       ┆ i32       │
╞═════════════════════╪═════════════════════╪═══════════╪═══════════╡
│ 2020-01-01 00:00:00 ┆ 2020-01-01 00:00:00 ┆ 2020      ┆ 2020      │
│ 2020-02-01 00:00:00 ┆ 2020-02-01 00:00:00 ┆ 2020      ┆ 2020      │
└─────────────────────┴─────────────────────┴───────────┴───────────┘