我想从URL中读取一组csv
个文件作为数据帧.这些文件的名称中包含日期,如YYYYMMDD.csv
.我需要迭代一组预定义的日期,并将相应的文件读入Python.
raise httperror(req.fullu url,code,msg,hdrs,fp)
urllib.错误HTTPError:HTTP错误404:未找到
在这种情况下,我会在日期上加一天,比如从2020-05-01
到2020-05-02
,如果抛出上述错误,我会在日期上加2天,或者最多加3天,直到有一个没有错误的url可用.
由于我没有数据,我将使用以下URL作为示例:
import pandas as pd
import requests
url = 'http://winterolympicsmedals.com/medals.csv'
s = requests.get(url).content
c = pd.read_csv(s)
这里正在读取的文件是medals.csv
.如果你try madels.csv
或modals.csv
,你会得到我所说的错误.因此,我需要知道如何通过替换文件名,分3步控制错误,直到获得所需的数据帧,比如首先我们try madels.csv
导致错误,然后models.csv
也导致错误,然后medals.csv
导致所需的输出.
我的问题是,有时我对文件的修改也会在except
分钟内失败,所以我需要知道如何适应第二次修改.