Excel文件的URL如下: https://www.gso.gov.vn/wp-content/uploads/2024/03/IIP-ENG.xlsx

我有这个代码:

from datetime import datetime, timedelta

url = 'https://www.gso.gov.vn/wp-content/uploads/' + datetime.strftime(datetime.now() - timedelta(30), '%y') +'/' + datetime.strftime(datetime.now() - timedelta(30), '%m') + '/IIP-ENG.xlsx'

import requests
resp = requests.get(url, verify=False)
output = open('IIP.xlsx', 'wb')
output.write(resp.content)
output.close()

我可以看到正在下载的文件,但无法在Office Excel中打开它.文件损坏了.

resp

<[404]>

我也不能用这个代码打开:

import pandas as pd
df = pd.read_excel(open('IIP.xlsx', 'rb'),sheet_name=0, engine='openpyxl')
print(df.head(5)) 

BadZipFile错误.该文件不是Zip文件.

怎么解决这个问题?

推荐答案

问题是年份格式,'%y'将得到24,你需要'%Y'作为2024年

datetime.strftime(datetime.now() - timedelta(30), '%Y')

Python相关问答推荐

使用mySQL的SQlalchemy过滤重叠时间段

Select 用a和i标签包裹的复选框?

韦尔福德方差与Numpy方差不同

通过Selenium从页面获取所有H2元素

如何让程序打印新段落上的每一行?

如何在python xsModel库中定义一个可选[December]字段,以产生受约束的SON模式

如何过滤包含2个指定子字符串的收件箱列名?

如何使Matplotlib标题以图形为中心,而图例框则以图形为中心

转换为浮点,pandas字符串列,混合千和十进制分隔符

如何在Python中使用Pandas将R s Tukey s HSD表转换为相关矩阵''

使用BeautifulSoup抓取所有链接

幂集,其中每个元素可以是正或负""""

为什么调用函数的值和次数不同,递归在代码中是如何工作的?

基于Scipy插值法的三次样条系数

使用tqdm的进度条

为什么我的scipy.optimize.minimize(method=";newton-cg";)函数停留在局部最大值上?

类型对象';敌人';没有属性';损害';

递归链表反转与打印语句挂起

Groupby并在组内比较单独行上的两个时间戳

将鼠标悬停在海运`pairplot`的批注/高亮显示上