Pandas定义了rame.agg,但DASK只定义了dask_rame.groupby.agg.

有没有一种方法在dask中不使用groupby的情况下在一列上实现多个聚合?

我知道presentation()有列统计,它解决了one个特定的问题,但我正在寻找一个通用的解决方案.

第一次try 是创建一个具有单个值和groupby(rup'min ','max '])的伪列. 结果工作了,但是创建的dask_DF是一个单行的多索引列,dask不能转置或堆叠(除非我做错了,否则无法实现). 我想把所有的结果都保留在dask中,即使结果表足够小,可以单独在pandas中运行,而且处理起来也很简单,但是我正在考虑在一般情况下,从本地结果导出、重新导入pandas是不可行的.

推荐答案

dask.series.reduction章可能会有效果,看docs

IIUC,关键是构建相关功能:aggregatecombine.

更新:也有dask.dataframe.reduction,看docs.

Python相关问答推荐

在函数内部使用eval(),将函数的输入作为字符串的一部分

将jit与numpy linSpace函数一起使用时出错

如何让Flask 中的请求标签发挥作用

try 将一行连接到Tensorflow中的矩阵

如何在Python中获取`Genericums`超级类型?

如何在达到end_time时自动将状态字段从1更改为0

在matplotlib中使用不同大小的标记顶部添加批注

当条件满足时停止ODE集成?

如何在Great Table中处理inf和nans

Polars map_使用多处理对UDF进行批处理

以异步方式填充Pandas 数据帧

使用Python异步地持久跟踪用户输入

如何获得3D点的平移和旋转,给定的点已经旋转?

使用Python TCP套接字发送整数并使用C#接收—接收正确数据时出错

有没有办法让Re.Sub报告它所做的每一次替换?

在我融化极点数据帧之后,我如何在不添加索引的情况下将其旋转回其原始形式?

Match-Case构造中的对象可调用性测试

为什么在不先将包作为模块导入的情况下相对导入不起作用

try 使用RegEx解析由标识多行文本数据的3行头组成的日志(log)文件

正则表达式反向查找