我正在构建一个机器学习模型,我需要用合成数据填充测试数据帧.我有时间序列数据,目前看起来是这样的:
Date DayOfWeek Unit
2022-10-01 7 A
2022-10-02 1 A
2022-10-03 2 A
我需要的是复制所有日期行,但我需要 for each "单位"(A、B、C、D)占一行,如下所示:
Date DayOfWeek Unit
2022-10-01 7 A
2022-10-01 7 B
2022-10-01 7 C
2022-10-01 7 D
2022-10-02 1 A
2022-10-02 1 B
2022-10-02 1 C
2022-10-02 1 D
2022-10-03 2 A
2022-10-03 2 B
2022-10-03 2 C
2022-10-03 2 D
我找到了一个previous answer,它教我如何重复:
df.reindex(df.index.repeat(4)).reset_index(drop=True)
最好的方法是什么,而不是重复所有的东西,只重复‘Date’和‘DayOfWeek’,但在‘单位’上填充A到D?