MWE:

html <- minimal_html('
    <p id="name1"><font size=5>Here is size 5 font </font></p>
    <p id="name2" class="second"><font size=3>And here is size 3 font </font></p>
   ')

html %>% html_elements('#name1')
html %>% html_elements('.second') 
html %>% html_elements('font')
html %>% html_elements('#5')
html %>% html_elements('.5')

我的目标是提取属性为"size=5"的所有元素.当属性为"id"或"class"(如上所示)时,我知道这样做的简单方法,但对于属性"size",我找不到任何方法.(我try 了html\u元素和html\u node .)在rvest包中是否有这样做的方法?

推荐答案

如果需要的话,我不知道如何使用CSS Select 器来实现这一点,但这里有一些XPath可以做到这一点:

html %>% html_elements(xpath = '//font[@size=5]')

输出:

{xml_nodeset (1)}
[1] <font size="5">Here is size 5 font </font>

或者,对于大小属性为5的真正all个元素(不仅仅是字体):

html %>% html_elements(xpath = '//*[@size=5]')

Html相关问答推荐

XPATH text()函数遇到困难

如何防止SVG图标出现断行?

UseEffect()从不调用preact

子元素的单一背景

禁用的文本区域会丢失换行符

文本幻灯片显示动画

元素offsetTop在滚动容器中时没有更改

网格项未在同一行上对齐

为什么我的 html 对话框在 React 中没有渲染在我的内容之上?

并排放置两个 div,同时 div2 环绕 div1

BeautifulSoup用名称列表的findall无法找到另一个目标后面的目标

网页设计不适合移动设备

如何更改 Quarto 中标签crossref-def-title的标题 colored颜色 ?

奇怪的幻影 div 命名为

CSS:第一个类型的伪类没有按预期工作

我应该如何使这个带有标签的隐藏复选框可访问

有没有办法使用 CSS border-radius 创建 HTML 视频标签的三角形显示?

使用 tailwind css 将 HTML/CSS/JS 站点转换为 React App

为什么浏览器在 Select 一个包裹在 标签中的块级元素后包含相邻元素?

动态使用时波浪号不转换为绝对路径