我想从一个网站刮文章,除了标题和网址,我想有一个日期,当文章发表.

我想要从中获取数据的html的一部分如下所示:

'''<time datetime="2023-10-09T16:46:47+00:00">
                            Yesterday, 18:46
                        </time>'''

我需要2023-10-09T16:46:47

我有的代码是:

for article in articles:
title = article.find("a", class_ = "newslink").text.strip()
article_url = urljoin(url,article.find("a")["href"])
date = article.select("time[datetime]")

但有了这个,我得到了:

[<time datetime="2023-10-06T06:27:49+00:00">
                                                                Friday, 08:27
                                                        </time>]

推荐答案

datetimetime元素的属性,可以这样访问:

desired_value = article.select_one("time").get('datetime')

desired_value = article.select_one("time")['datetime']

See BeautifulSoup documentation f或 m或e.

Python相关问答推荐

Locust请求中的Python和参数

如何检测背景有噪的图像中的正方形

类型错误:输入类型不支持ufuncisnan-在执行Mann-Whitney U测试时[SOLVED]

删除所有列值,但判断是否存在任何二元组

在Python中管理打开对话框

如何使用根据其他值相似的列从列表中获取的中间值填充空NaN数据

我们可以为Flask模型中的id字段主键设置默认uuid吗

如何使用pytest来查看Python中是否存在class attribution属性?

我对我应该做什么以及我如何做感到困惑'

如果满足某些条件,则用另一个数据帧列中的值填充空数据帧或数组

启用/禁用shiny 的自动重新加载

如何在Python中使用Pandas将R s Tukey s HSD表转换为相关矩阵''

dask无groupby(ddf. agg([min,max])?''''

在Python中使用yaml渲染(多行字符串)

Polars map_使用多处理对UDF进行批处理

如何使用pytest在traceback中找到特定的异常

使用np.fft.fft2和cv2.dft重现相位谱.为什么结果并不相似呢?

如何关联来自两个Pandas DataFrame列的列表项?

与同步和异步客户端兼容的Python函数

来自任务调度程序的作为系统的Python文件