我有一张这样的桌子:

Column1 Column2
John 2
John 8
John 8
John 8
Robert 5
Robert 5
Robert 1
Carl 8
Carl 7

现在我想要的是用Column1来聚合这个DataFrame,并得到maxcount的值,给定的max value对于每个组出现了多少次.

因此,输出应如下所示:

Column1 Max Count_of_Max
John 8 3
Robert 5 2
Carl 8 1

我一直在try 做这样的事情:

def Max_Count(x):
       a = df.loc[x.index]
       return a.loc[a['Column2'] == a['Column2'].max(), 'Column2'].count()

df.groupby(["Column1"]).agg({'Column2': ["max", Max_Count]}).reset_index()

但这并不是真的奏效:

怎样才能达到预期的效果呢?

推荐答案

df.groupby('Column1').agg({
    'Column2': [max, lambda x: (x==max(x)).sum()]
}).rename(columns={'max': 'Max', '<lambda_0>': 'Count_of_Max'})

Python相关问答推荐

如何分割我的收件箱,以便连续的数字各自位于自己的收件箱中?

使用unmanagedexports从Python调用的c#DLC

如何从不同长度的HTML表格中抓取准确的字段?

在Python中,什么表达相当于0x1.0p-53?

socket.gaierror:[Errno -2]名称或服务未知|Firebase x Raspberry Pi

Polars Dataframe:如何按组删除交替行?

过滤绕轴旋转的螺旋桨

将轨迹优化问题描述为NLP.如何用Gekko解决这个问题?当前面临异常:@错误:最大方程长度错误

如何避免Chained when/then分配中的Mypy不兼容类型警告?

如何制作10,000年及以后的日期时间对象?

如何获取numpy数组的特定索引值?

将tdqm与cx.Oracle查询集成

将9个3x3矩阵按特定顺序排列成9x9矩阵

根据列值添加时区

如何在图中标记平均点?

启动带有参数的Python NTFS会导致文件路径混乱

Pandas Data Wrangling/Dataframe Assignment

Polars将相同的自定义函数应用于组中的多个列,

搜索按钮不工作,Python tkinter

Python—压缩叶 map html作为邮箱附件并通过sendgrid发送