我正在try 用scrapy从this个eBay列表中删除Monday, 9:30 AM个.

从一个破烂的贝壳scrapy shell https://www.ebay.com/itm/145599690533?:

>>> response.css('span.ux-timer__time-left::text')
[]

我还try 了从Firefox Dev复制css路径和XPath,但结果相同.

我怀疑这个问题与明文之前的::before有关,但我对此几乎一无所知.

我错过了什么?

推荐答案

事实上,你什么都不会错过.您的元素 Select 是正确的,但是scrapyshell 没有得到任何元素,因为该值是由JavaScript填充的,而scrapy无法模仿它.

只需举个例子,说明您的CSS Select 正在使用Selify和Beautiful Soup :

import time
from selenium import webdriver
from selenium.webdriver.chrome.service import Service
from webdriver_manager.chrome import ChromeDriverManager
from bs4 import BeautifulSoup

options = webdriver.ChromeOptions()
options.add_argument("start-maximized")
#chrome to stay open
options.add_experimental_option("detach", True)

driver = webdriver.Chrome(service=Service(ChromeDriverManager().install()),options=options)

driver.get("https://www.ebay.com/itm/145599690533?")
time.sleep(5)

soup = BeautifulSoup(driver.page_source, 'lxml')
date = soup.select_one('span.ux-timer__time-left').get_text()
print(date)

Output:

Monday, 08:30 PM

Python相关问答推荐

比较两个二元组列表,NP.isin

将特定列信息移动到当前行下的新行

为什么tkinter框架没有被隐藏?

ODE集成中如何终止solve_ivp的无限运行

当递归函数的返回值未绑定到变量时,非局部变量不更新:

Python导入某些库时非法指令(核心转储)(beautifulsoup4."" yfinance)

计算天数

解决调用嵌入式函数的XSLT中表达式的语法移位/归约冲突

为什么调用函数的值和次数不同,递归在代码中是如何工作的?

Polars Group by描述扩展

如何在GEKKO中使用复共轭物

在我融化极点数据帧之后,我如何在不添加索引的情况下将其旋转回其原始形式?

如何在PythonPandas 中对同一个浮动列进行逐行划分?

Polars时间戳同步延迟计算

将字节序列解码为Unicode字符串

分解polars DataFrame列而不重复其他列值

具有不匹配列的2D到3D广播

Pandas 删除只有一种类型的值的行,重复或不重复

时间戳上的SOAP头签名无效

Groupby并在组内比较单独行上的两个时间戳