我试着从"Economia"部分的这个web page中获得这个值:

enter image description here

我想要得到所有的头衔.这是我当前的代码:

html = client.get("http://larepublica.pe/")
soup = BeautifulSoup(html.text, 'html.parser')

# Obtener la noticia de portada principal
economyNews = ""
for div in soup.findAll('h2', attrs={'class':'ItemSection_itemSection__title__PleA9'}):
    n = div.text
    economyNews += n+"\\n"

print(economyNews )

我已经测试了很多方法来获得这个,但似乎网页锁定了这个. 任何解决这个问题的 idea ,伙计们,我都会很感激的.非常感谢.

推荐答案

您可以try :

import requests
from bs4 import BeautifulSoup

url = "https://larepublica.pe/"

headers = {
    "User-Agent": "Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:109.0) Gecko/20100101 Firefox/118.0"
}

soup = BeautifulSoup(requests.get(url, headers=headers).content, "html.parser")


for h2 in soup.select("div:has(*:-soup-contains(Economía)) + div h2"):
    print(h2.text)

打印:

Banco Mundial: tasas de interés se mantendrán altas por más tiempo
Precio del dólar cierra al alza y se ubica en S/3,831 este miércoles 11 de octubre
Retiro AFP: ¿cuándo fue la última vez que se autorizó la liberación de fondos y cuánto se devolvió?
Debate sobre RETIRO AFP 2023: SBS y Congreso deliberaron sobre posible medida

Python相关问答推荐

如何根据另一列值用字典中的值替换列值

三个给定的坐标可以是矩形的点吗

Python上的Instagram API:缺少client_id参数"

运行总计基于多列pandas的分组和总和

从一个系列创建一个Dataframe,特别是如何重命名其中的列(例如:使用NAs/NaN)

如何启动下载并在不击中磁盘的情况下呈现响应?

在嵌套span下的span中擦除信息

try 检索blob名称列表时出现错误填充错误""

寻找Regex模式返回与我当前函数类似的结果

从列表中获取n个元素,其中list [i][0]== value''

巨 Python :逆向猜谜游戏

如何使用正则表达式修改toml文件中指定字段中的参数值

如何将一组组合框重置回无 Select tkinter?

如何使用pytest在traceback中找到特定的异常

如何从数据框列中提取特定部分并将该值填充到其他列中?

高效地计算数字数组中三行上三个点之间的Angular

对当前的鼹鼠进行编码,并且我的按键获得了注册

ValueError:必须在Pandas 中生成聚合值

使用元组扩展字典的产品挑战

如何在networkx图中提取和绘制直接邻居(以及邻居的邻居)?