我正在抓取一个使用数据属性的网站,将数据的名称与值本身一起放在值中.
<div data-title="Subscribers: 4,471"></div>
我想知道如何根据div应该包含"订阅者"的部分值来获取这div
,如下所示(*表示要查找的模式):
test = soup.find_all("div", {"data-title": "Subscribers"*})
我正在抓取一个使用数据属性的网站,将数据的名称与值本身一起放在值中.
<div data-title="Subscribers: 4,471"></div>
我想知道如何根据div应该包含"订阅者"的部分值来获取这div
,如下所示(*表示要查找的模式):
test = soup.find_all("div", {"data-title": "Subscribers"*})
您可以使用css selectors
并判断属性值:
starts,配上你的图案
soup.select('[data-title^="Subscribers"]')
ends,配上你的图案
soup.select('[data-title$="Subscribers"]')
contains个你喜欢的图案
soup.select('[data-title*="Subscribers"]')
from bs4 import BeautifulSoup
html = '''
<div data-title="Subscribers: 4,471"></div>
<div data-title="Views: 1,000"></div>
'''
soup = BeautifulSoup(html)
soup.select('[data-title^="Subscribers"]')