假设我有以下数据帧:
date group value
2022-11-01. 1 4
2022-11-02. 1 12
2022-11-03. 1 14
2022-11-04. 1 25
2021-11-01. 2 9
2021-11-02. 2 7
2019-10-01. 3 40
2022-10-02. 3 14
我想 for each 组创建一个基于日期递增整数的新列.例如,这是所需的输出:
date group value new_col
2022-11-01. 1 4. 0
2022-11-02. 1 12. 1
2022-11-03. 1 14. 2
2022-11-04. 1 25. 3
2021-11-01. 2 9. 0
2021-11-02. 2 7. 1
2019-10-01. 3 40. 0
2022-10-02. 3 14. 1
您看,new_col1大概是np,arange(0, len(df['date'])+1)
个,但是我想按组来做,而且似乎没有任何Groupby的变体适合我.
我试过了:
df.groupby('group')['date'].apply(lambda x: np.arange(0, len(x)+1)
然而,这与我想要的还差得很远.如果有人能解释如何正确地做这件事,我将不胜感激.