我有一个数据帧,其中包含分类变量和每行的几个属性:
df = ID C1 C2 .... Cn flag
1 a b c True
1 a c d False
1 q t p False
1 g y p False
2 r h k False
对于每一列和每个ID值,我需要最常见的(和出现的次数)和最后一个值. 我还想知道它的列标志中是否至少有一个‘True’. 所以我会得到:
out = ID c1_common c1_common_n c1_latest c2_common c2_common_n c2_latest ... has_flag
1 a 2 g y 1 y True
2 r 1 r h 1 h False
这样做的最佳方式是什么?