我如何请求特定的标签?例如,我希望将页脚作为输出,而不是整个HTML页面.我该怎么做?

import requests as req
    
resp = req.get("site")    
print(resp.text)

我只想将其作为输出,而不是整个HTML文件;这可能吗?

<footer class="footer">
    <ol>
        <li class="nav-item">
            <a class="nav-link active" aria-current="page" href="index.html">Home</a>
        </li>
        <li class="nav-item">
            <a class="nav-link" href="about_us.html"> About us</a>
        </li>
        <li class="nav-item">
            <a class="nav-link" href="ticket.html"> Submit a ticket</a>
        </li>
        <li class="nav-item">
            <a class="nav-link" href="tos.html"> Terms of use</a>
        </li>
        <li class="nav-item">
            <a class="nav-link" href="donate.html"> Donate</a>
        </li>
        <li class="nav-item">
            <a class="nav-link" href="news.html"> News</a>
        </li>
        <li class="nav-item">
            <a class="nav-link" href="quotes.html"> Quotes</a>
        </li>
    </ol>
</footer>

推荐答案

您可以使用(requests-HTML)代替REQUESTS.在这里,您可以从html页面提取特定的类.

这应该是可行的:

from requests_html import HTMLSession

session = HTMLSession()

r = session.get('http://ilyabr.com')
print( r.html.find('.footer', first=True).html )

Python相关问答推荐

提取两行之间的标题的常规表达

rame中不兼容的d类型

按顺序合并2个词典列表

Python库:可选地支持numpy类型,而不依赖于numpy

如何调整QscrollArea以正确显示内部正在变化的Qgridlayout?

Python—从np.array中 Select 复杂的列子集

Pre—Commit MyPy无法禁用非错误消息

形状弃用警告与组合多边形和多边形如何解决

如何在UserSerializer中添加显式字段?

如何使用scipy的curve_fit与约束,其中拟合的曲线总是在观测值之下?

Python全局变量递归得到不同的结果

如何在两列上groupBy,并使用pyspark计算每个分组列的平均总价值

为什么Python内存中的列表大小与文档不匹配?

Cython无法识别Numpy类型

Js的查询结果可以在PC Chrome上显示,但不能在Android Chrome、OPERA和EDGE上显示,而两者都可以在Firefox上运行

如何获取包含`try`外部堆栈的`__traceback__`属性的异常

操作布尔值的Series时出现索引问题

用由数据帧的相应元素形成的列表的函数来替换列的行中的值

将相应的值从第2列合并到第1列(Pandas )

为什么在安装了64位Python的64位Windows 10上以32位运行?