我有一个数据帧,比如
id occurence status
0 1 1 validated
1 2 1 validated
2 3 1 validated
3 1 10
关联[id,ocurence]是唯一的,这意味着我将只有一个组合[1,1]或[1,10]. 具有出现10的行将始终被添加到具有出现1的行之后的数据帧上.
每次看到出现10的新行时,我要做的是判断是否存在具有相同id和出现1的另一行,然后从行[id,1]中提取状态,并相应地更新行[id,10]的状态.
现在,我可以像这样提取副本
df[df['id'].duplicated(keep=False)]
它返回一个包含所有重复项的数据帧,但我不知道如何 Select 第一个事件的状态值……
我也try 了这样的东西:
df.groupby('id').transform(lambda x: x.update({'status': 'validated'})
开始是一个静态值,但它给了我一个没有填充的数据帧……
你知道这件事吗?
谢谢