我有很多顾客
CUST_ID | SEGMENT | AREA
1 | B | CAD
1 | A | RAM
2 | B | CAD
2 | C | RAM
3 | B | RAM
4 | A | RAM
我想数一数每SEGMENT
人中CUST_ID
人的唯一数字,所以我做了
df.groupby(['SEGMENT'])['CUST_ID'].nunique()
然而,如果有相同的CUST_ID
个不同的SEGMENT
类型,那么每SEGMENT
个的数量就会inflating .我想 Select 最高值SEGMENT
/CUST_ID
,然后计数.A是最高的,C是最低的.因此产生的df看起来像:
CUST_ID | SEGMENT | AREA
1 | A | RAM
2 | B | CAD
3 | B | RAM
4 | A | RAM
而伯爵则是
- A-2
- B-2
- C-0
我怎样才能做到这一点?