我有一个EXCEL文件,其中包含一些同名的列,我想在融化数据之前将其导入到多个数据帧中.如何才能在我的数据帧中包含原始列的名称.问题是我的数据帧包含名为ex:A、A.1、A.2的列. 目前,我正在重新命名这些列,但不会有更好的方法.
我试着重命名列,但太长了(我有30多个列被重复和重命名了10次以上),我想要一个更快的方法或函数来做得更好
我有一个EXCEL文件,其中包含一些同名的列,我想在融化数据之前将其导入到多个数据帧中.如何才能在我的数据帧中包含原始列的名称.问题是我的数据帧包含名为ex:A、A.1、A.2的列. 目前,我正在重新命名这些列,但不会有更好的方法.
我试着重命名列,但太长了(我有30多个列被重复和重命名了10次以上),我想要一个更快的方法或函数来做得更好
没有"开箱即用"的方法可以做到这一点,但是您可以删除这个带有str.replace
的后缀:
df.columns = df.columns.str.replace(r'\.\d+$', '', regex=True)
示例(包含read_csv
个):
import pandas as pd
import io
df = pd.read_csv(io.StringIO('A,B,C,A,B,C\n1,2,3,4,5,6'))
df.columns = df.columns.str.replace(r'\.\d+$', '', regex=True)
print(df)
输出:
A B C A B C
0 1 2 3 4 5 6