我用bs4浏览了一堆网站,从每个页面上抓取一个特定的链接,但我在抓取这个链接时遇到了一个问题.
我已经try 使用获取所有链接.
soup = BeautifulSoup(browser.page_source,"lxml")
print(soup.find_all('a'))
我try 了许多其他方法,包括告诉它一个网站的确切地址.
但每次似乎都会返回我想要的链接之外的所有内容.
For context my code goes to pages of this site
https://ce.naco.org/?find=true
These are two of many pages that I am searching for the link in
https://ce.naco.org/?county_info=06019
https://ce.naco.org/?county_info=08045
在"COUNTY CONTACT"下,这些页面中的大多数都有一个链接,这是我想要获取的链接,但我只是找不到方法使其返回,只返回bs4似乎看不见的链接.
我认为这与页面如何根据用户点击的内容加载数据有关,而且由于bs4没有与站点交互,所以它没有加载数据???但这只是一个猜测.