我可以使用以下命令从列中删除超过95%的数据:
df[df.value < df.value.quantile(.95)]
如何删除按另一列分组的95%以上的数据?
因此,如果我有一个如下所示的数据帧,我想删除第1行,因为它在类型A中大于95%.
Row type value
1 A 100000
2 A 0.1
3 A 0.3
4 B 10
5 B 11
编辑:我想删除所有类型的95%以上的数据-删除A型、B型等的95%以上的数据