如果一个表连续3次具有相同的索引,我希望它为我获取此数据帧.
示例
index var1
1 a
2 b
2 c
2 d
3 e
2 f
5 g
2 f
在代码之后
预期yields
index var1
2 b
2 c
2 d
如果一个表连续3次具有相同的索引,我希望它为我获取此数据帧.
示例
index var1
1 a
2 b
2 c
2 d
3 e
2 f
5 g
2 f
在代码之后
预期yields
index var1
2 b
2 c
2 d
让我们用cumsum
标识连续索引的块,然后用count
对transform
分组,找出每个块的大小,然后 Select 块大小为> 2
的行
b = df['index'].diff().ne(0).cumsum()
df[b.groupby(b).transform('count') > 2]
index var1
1 2 b
2 2 c
3 2 d