我有一个具有以下 struct 的Pandas DataFrame:
import pandas as pd
data = {
'USIM': ['1111111', '2199608', '2222222', '4444444', '1111111', '2111111', '2222222', '4444444'],
'WEBSHOP_ORDER': [0, 0, 0, 0, 1, 1, 1, 1],
'DEMAND_QTY': [1, 3, 2, 1, 5, 9, 8, 6]
}
df = pd.DataFrame(data)
我想要计算每个USIM在网上store 订单中的平均项目数.USIM列表示唯一标识符,Webshop_Order列表示每个条目的订单ID,Demand_Qty列表示每个订单中的项目数.
我希望获得以下输出:
USIM AVG_ITEMS_IN_WEBSHOP_ORDER
0 1111111 17.5 # (28+7)/2 *
1 2111111 28.0
2 2199608 7.0
3 2222222 17.5
4 4444444 17.5
# * 28 is the sum of WEBSHOP_ORDER == 1
# 7 is the sum of WEBSHOP_ORDER == 0
AVG_ITEMS_IN_WEBSHOP_ORDER列表示每个唯一USIM值在网上store 订单中的平均项目数.
有没有人能帮我讲讲实现这一点的逻辑或代码?谢谢!