我有一个EXCEL文件,其中包含一些同名的列,我想在融化数据之前将其导入到多个数据帧中.如何才能在我的数据帧中包含原始列的名称.问题是我的数据帧包含名为ex:A、A.1、A.2的列. 目前,我正在重新命名这些列,但不会有更好的方法.

我试着重命名列,但太长了(我有30多个列被重复和重命名了10次以上),我想要一个更快的方法或函数来做得更好

推荐答案

没有"开箱即用"的方法可以做到这一点,但是您可以删除这个带有str.replace的后缀:

df.columns = df.columns.str.replace(r'\.\d+$', '', regex=True)

示例(包含read_csv个):

import pandas as pd
import io

df = pd.read_csv(io.StringIO('A,B,C,A,B,C\n1,2,3,4,5,6'))
df.columns = df.columns.str.replace(r'\.\d+$', '', regex=True)
print(df)

输出:

   A  B  C  A  B  C
0  1  2  3  4  5  6

Python相关问答推荐

try 使用tensorFlow.keras.models时optree Import错误

如何将自动创建的代码转换为类而不是字符串?

如何在Pygame中绘制右对齐的文本?

使用Python C API重新启动Python解释器

如何知道标志是否由用户传递或具有默认值?

如何在msgraph.GraphServiceClient上进行身份验证?

根据不同列的值在收件箱中移动数据

根据在同一数据框中的查找向数据框添加值

如何在箱形图中添加绘制线的传奇?

如何访问所有文件,例如环境变量

在Python Attrs包中,如何在field_Transformer函数中添加字段?

更改键盘按钮进入'

如何在solve()之后获得症状上的等式的值

连接一个rabrame和另一个1d rabrame不是问题,但当使用[...]'运算符会产生不同的结果

mypy无法推断类型参数.List和Iterable的区别

如何并行化/加速并行numba代码?

索引到 torch 张量,沿轴具有可变长度索引

在matplotlib中删除子图之间的间隙_mosaic

dask无groupby(ddf. agg([min,max])?''''

Gunicorn无法启动Flask应用,因为无法将应用解析为属性名或函数调用.'"'' "