我想从一个网站刮文章,除了标题和网址,我想有一个日期,当文章发表.
我想要从中获取数据的html的一部分如下所示:
'''<time datetime="2023-10-09T16:46:47+00:00">
Yesterday, 18:46
</time>'''
我需要2023-10-09T16:46:47
我有的代码是:
for article in articles:
title = article.find("a", class_ = "newslink").text.strip()
article_url = urljoin(url,article.find("a")["href"])
date = article.select("time[datetime]")
但有了这个,我得到了:
[<time datetime="2023-10-06T06:27:49+00:00">
Friday, 08:27
</time>]