我需要解析(服务器端)大量的HTML页面

没有节点.你有这种能力吗

推荐答案

您可以使用npm个模块jsdomhtmlparser在节点中创建和解析DOM.JS.

其他选择包括:

在所有这些选项中,我更喜欢使用节点.js选项,因为它使用标准的W3C DOM访问器方法,我可以在客户端和服务器上重用代码.我希望BeautifulSoup的方法更类似于W3C dom,我认为将HTML转换为XHTML来编写XSLT简直是太残忍了.

Node.js相关问答推荐

Sharp JS 依赖关系破坏了 Elastic Beanstalk 上的 Express Server

try 运行迁移时的 Typeorm:缺少必需的参数:dataSource

为什么我在生产环境中 deproy Next.js 示例项目时 CSS 不起作用?

如何列出我与 npm 链接的所有 Node.js 模块

eslint - vscode 的可选链接错误

错误:PostCSS 插件 tailwindcss 需要 PostCSS 8

__dirname 未在 Node 14 版本中定义

如何修复错误 - nodemon.ps1 无法加载,因为在此系统上禁用了运行脚本(没有安全风险)?

npm 不支持 Node.js v12.18.3

graphqlHTTP 不是函数

Handlebars:访问已被拒绝解析“来自”的属性,因为它不是其父级的“自己的属性”

如何在不进行 npm install 的情况下更新 package-lock.json?

try 将 DOMParser 与节点 js 一起使用

Express.js中的“bodyParser.urlencoded({extended: true }))”和“bodyParser.json()”是什么意思?

Nest.js 中的拦截器、中间件和过滤器有什么区别?

npm install 给出警告,npm audit fix 不起作用

如何禁用 React JS 应用程序的源映射

create-react-app:如何使用特定浏览器“npm start”?

如何在 package.json 中使用变量?

ENOSPC 设备上没有剩余空间 -Nodejs