我正试图在销售数据库中判断广告数量是否发生了变化. 我使用的示例数据帧如下所示:
df = pd.DataFrame({"offer-id": [1,1,2,2,3,4,5], "date": ["2024-02-10","2024-02-11","2024-02-10","2024-02-11","2024-02-11","2024-02-11","2024-02-10"], "price": [30,10,30,30,20,25,20]})
如下图所示:
我现在试图获得已售出或新添加的项目的#(我不在乎哪一个,因为一旦我有一个,其他应该很容易计算).
例如,在一个完美的例子中,下一段代码告诉我,在2月3日10日,网上有优惠活动(ID 1、2和5),有一项活动已售出(ID 5) 或者,它告诉我2月11日有4个报价在网上,其中2个是新的(从这一点来看,因为我知道5个在网上的前一天,我也可以计算出肯定有一个已经售出)
有什么简单的方法可以做到这一点吗? 我试过像这样的东西
df.groupby(['date'])["offer-id"].agg({'nunique'})
但是它们缺少"与先前的比较"时间步分量.