我正试着用北极熊取代一些Pandas .我是北极星的新手.

原始代码:

return pd.DataFrame(
    data.groupby([list_of_fields]).size(),
    columns=["Count"],
).reset_index()

我被困在如何命名列"计数".到目前为止,我已经try 过:

return pl.DataFrame(data.groupby([list_of_fields]).n_unique( "Count"))

但这给了我们:

TypeError: n_unique() takes 1 positional argument but 2 were given

n_unique似乎仅在未附加到groupby时才允许使用名称参数.我怎么能这样做呢?

推荐答案

在Pandas 中,DataFrameGroupBy.size是计算每组的行数.

在极性中,这可以通过使用pl.len来实现.我们从一些示例数据开始.

import polars as pl

df = pl.DataFrame({
    "group": ["A", "A", "A", "B", "B", "C"],
})
shape: (6, 1)
┌───────┐
│ group │
│ ---   │
│ str   │
╞═══════╡
│ A     │
│ A     │
│ A     │
│ B     │
│ B     │
│ C     │
└───────┘

现在,使用

df.group_by("group", maintain_order=True).agg(pl.len().alias("Count"))

赠送

shape: (3, 2)
┌───────┬───────┐
│ group ┆ Count │
│ ---   ┆ ---   │
│ str   ┆ u32   │
╞═══════╪═══════╡
│ A     ┆ 3     │
│ B     ┆ 2     │
│ C     ┆ 1     │
└───────┴───────┘

请注意,我们已经使用pl.Expr.alias重命名了group_by上下文中的pl.len()表达式.

Python相关问答推荐

Locust请求中的Python和参数

线性模型PanelOLS和statmodels OLS之间的区别

如何在msgraph.GraphServiceClient上进行身份验证?

不理解Value错误:在Python中使用迭代对象设置时必须具有相等的len键和值

如何获取numpy数组的特定索引值?

转换为浮点,pandas字符串列,混合千和十进制分隔符

UNIQUE约束失败:customuser. username

Python列表不会在条件while循环中正确随机化'

如何更新pandas DataFrame上列标题的de值?

Flash只从html表单中获取一个值

如何杀死一个进程,我的Python可执行文件以sudo启动?

LocaleError:模块keras._' tf_keras. keras没有属性__internal_'''

寻找Regex模式返回与我当前函数类似的结果

如何在验证文本列表时使正则表达式无序?

使用SQLAlchemy从多线程Python应用程序在postgr中插入多行的最佳方法是什么?'

使用np.fft.fft2和cv2.dft重现相位谱.为什么结果并不相似呢?

TypeError:';Locator';对象无法在PlayWriter中使用.first()调用

一维不匹配两个数组上的广义ufunc

Numpy`astype(Int)`给出`np.int64`而不是`int`-怎么办?

对包含JSON列的DataFrame进行分组