我有一个产品数据库,我必须验证产品ID是否在一列中重复,还必须验证它在另一列中是否为"真"或"假".然后,如果至少有一个复制行为"真",则将all设置为"真".
我在这个链接中找到了一种方法:Create rule for sets of duplicates in a Pandas Dataframe使用第二个答案,但它在我的数据库中花费了太多的时间,比如8分钟.
有人知道如何更快地做到这一点吗?
例子:
ID Active
01 False
01 False
01 True
02 False
02 False
03 True
03 False
03 False
最后应该是这样的:
ID Active
01 True
01 True
01 True
02 False
02 False
03 True
03 True
03 True