输入数据帧df
如下所示:
item row
Apple 12
Apple 12
Apple 13
Orange 13
Orange 14
Lemon 14
输出数据帧需要
item unique_row nunique_row count
Apple {12,13} 2 {2,1}
Orange {13,14} 2 {1,1}
Lemon {14} 1 {1}
Tried Code:个
df.groupby('item', as_index=False)['row'].agg({'unique_row': lambda x: set(x)
,'nunique_row': lambda x: len(set(x))})
因此,在这里,不确定如何在.agg
函数中添加条件来生成列‘count
’.列‘count
’表示每个行值的value_count
个数字.
任何帮助都将不胜感激.谢谢!