我正在建设一条管道,不幸的是,它需要从另一个团队移交数据.我们发现,特定数据的工作表名称存在格式问题.工作表应该按全小写的数据对应的月份命名.然而,我们现在已经多次收到了全大写和大小写混合的文件.我相信这个文件是手动生成的,所以工作表并不总是在相同的位置(大多数时候是第一个工作表,但偶尔也是第二个).有没有办法以编程方式使用Pandas READ_EXCEL函数以不区分大小写的方式读取工作表名称?
我正在建设一条管道,不幸的是,它需要从另一个团队移交数据.我们发现,特定数据的工作表名称存在格式问题.工作表应该按全小写的数据对应的月份命名.然而,我们现在已经多次收到了全大写和大小写混合的文件.我相信这个文件是手动生成的,所以工作表并不总是在相同的位置(大多数时候是第一个工作表,但偶尔也是第二个).有没有办法以编程方式使用Pandas READ_EXCEL函数以不区分大小写的方式读取工作表名称?
您可以使用ExcelFile
:
sheet_name = 'data2' # what you are looking for
with pd.ExcelFile('data.xlsx') as xlsx:
sheets = [sheet.lower() for sheet in xlsx.sheet_names]
# If the sheet is not found, it will a ValueError exception
idx = sheets.index(sheet_name)
df = pd.read_excel(xlsx, sheet_name=idx)
详细信息:
>>> xlsx.sheet_names
['Data1', 'DATA2', 'data3']
>>> sheets
['data1', 'data2', 'data3']
>>> sheets.index(sheet_name)
1