假设我有一个Pandas DataFrame:
import pandas as pd
df = pd.DataFrame({'a': [1,2,2,2,2,1,1,1,2,2]})
>> df
a
0 1
1 2
2 2
3 2
4 2
5 1
6 1
7 1
8 2
9 2
如果超过某个阈值n
,我想删除重复项,并用该最小值替换它们.让我们说这是n=3
.然后,我的目标数据帧是
>> df
a
0 1
1 2
2 2
3 2
5 1
6 1
7 1
8 2
9 2
编辑:每一组连续的重复都是单独考虑的.在本例中,应该保留第8行和第9行.