Python dask无groupby(ddf. agg([min，max])''''

发布于03月23日

Pandas定义了rame.agg，但DASK只定义了dask_rame.groupby.agg.

有没有一种方法在dask中不使用groupby的情况下在一列上实现多个聚合？

我知道presentation()有列统计，它解决了one个特定的问题，但我正在寻找一个通用的解决方案.

第一次try 是创建一个具有单个值和groupby(rup'min '，'max '])的伪列. 结果工作了，但是创建的dask_DF是一个单行的多索引列，dask不能转置或堆叠(除非我做错了，否则无法实现). 我想把所有的结果都保留在dask中，即使结果表足够小，可以单独在pandas中运行，而且处理起来也很简单，但是我正在考虑在一般情况下，从本地结果导出、重新导入pandas是不可行的.

Python dask无groupby(ddf. agg([min，max])''''

推荐答案

Python相关问答推荐

在函数内部使用eval()，将函数的输入作为字符串的一部分

将jit与numpy linSpace函数一起使用时出错

如何让Flask 中的请求标签发挥作用

try 将一行连接到Tensorflow中的矩阵

如何在Python中获取`Genericums`超级类型？

如何在达到end_time时自动将状态字段从1更改为0

在matplotlib中使用不同大小的标记顶部添加批注

当条件满足时停止ODE集成？

如何在Great Table中处理inf和nans

Polars map_使用多处理对UDF进行批处理

以异步方式填充Pandas 数据帧

使用Python异步地持久跟踪用户输入

如何获得3D点的平移和旋转，给定的点已经旋转？

使用Python TCP套接字发送整数并使用C#接收—接收正确数据时出错

有没有办法让Re.Sub报告它所做的每一次替换？

在我融化极点数据帧之后，我如何在不添加索引的情况下将其旋转回其原始形式？

Match-Case构造中的对象可调用性测试

为什么在不先将包作为模块导入的情况下相对导入不起作用

try 使用RegEx解析由标识多行文本数据的3行头组成的日志(log)文件

正则表达式反向查找