我正试着在网上搜索花旗自行车的旅行数据.因为我要下载多个文件,所以我想最好是通过访问所需的链接,然后使用其他方法来下载它们,从而用python自动完成这项工作
以下是我的代码:
url = 'https://s3.amazonaws.com/tripdata/index.html'
html_source = requests.get(url).text
soup = BeautifulSoup(html_source, "html.parser")
soup.prettify()
# I'm successful until I add '.find_all('tr')' at the end
citibikedata = soup.find('tbody', id = "tbody-content").find_all('tr')
print(citibikedata)
当我try 打印时,我得到的是空的list
.如果我做长度(len
),我得到0.
然而,如果我go 掉find_all()
,我只得到tbody-content
的结果.
我怀疑,由于某种原因,我无法访问tr
标签.同时,还有另一层标记‘td’,我必须访问它才能获取我实际正在查找的数据,即a
标记中的href
和文本.
如果我错过了什么,我将非常感谢你的帮助.我要提前谢谢你
我找不到访问没有类的标签的在线资源,这是我对这个问题的怀疑.或许并非如此.