我有一个数据框,包含数据列、客户列和大小如下:
Customer | Date | Size |
---|---|---|
Cust1 | 20/10/2021 | 4 |
Cust1 | 21/10/2021 | 5 |
Cust1 | 22/10/2021 | 6 |
Cust1 | 23/10/2021 | 6 |
Cust2 | 20/10/2021 | 4 |
Cust2 | 21/10/2021 | 5 |
Cust2 | 22/10/2021 | 6 |
Cust2 | 23/10/2021 | 6 |
Cust3 | 20/10/2021 | 4 |
Cust3 | 21/10/2021 | 5 |
Cust3 | 22/10/2021 | 6 |
Cust3 | 23/10/2021 | 6 |
我需要从客户那里提取每个第n个日期,然后删除其余日期.在本例中,每2秒:
|Customer|Date|Size|
|--------|----|----|
|Cust1 |20/10/2021|4|
|Cust1 |22/10/2021|6|
|Cust2 |20/10/2021|4|
|Cust2 |22/10/2021|6|
|Cust3 |20/10/2021|4|
|Cust3 |22/10/2021|6|
很抱歉格式不好,但表格格式不适用于第二个表格.
实际上是每10天一次,从最近一次开始.
df_10 = df.iloc[::10, :]
AttributeError: 'DataFrameGroupBy' object has no attribute 'iloc'
老实说,我根本不坚持使用groupby,但到目前为止还没有找到有效的解决方案.
非常感谢.