在Python语言中,我有一个Pandas 时间戳列表,例如,考虑下面的输入提示input: list[list[pd.Timestamp]]
import pandas as pd
import numpy as np
# Example list of lists of Pandas Timestamps
input = [[pd.Timestamp('2023-09-01 10:00:00'), pd.Timestamp('2023-09-01 11:00:00')],
[pd.Timestamp('2023-09-02 12:00:00'), pd.Timestamp('2023-09-02 13:00:00')],
[pd.Timestamp('2023-09-03 14:00:00'), pd.Timestamp('2023-09-03 15:00:00')]]
此输入表示日期时间范围的列表. 为了调试和简单起见,我倾向于将此信息作为数据帧来查看:
input_df = pd.DataFrame(input, columns=[['left', 'right']])
现在我需要:
- 平坦化输入
- 删除重复项
- 应用相同的字符串格式(以矢量化的方式,例如对所有元素应用
strftime("%Y/%m/%d/%H")
)
现在,我应该在Pandas、Numpy(因为所有元素都是同一类型的元素)中执行此操作,还是在Python中执行此操作? 最快、最优雅的方式是什么?