我需要解析(服务器端)大量的HTML页面

没有 node .你有这种能力吗

推荐答案

您可以使用npm个模块jsdomhtmlparser在 node 中创建和解析DOM.JS.

其他 Select 包括:

在所有这些选项中,我更喜欢使用 node .js选项,因为它使用标准的W3C DOM访问器方法,我可以在客户端和服务器上重用代码.我希望BeautifulSoup的方法更类似于W3C dom,我认为将HTML转换为XHTML来编写XSLT简直是太残忍了.

Node.js相关问答推荐

Windows上使用ES6+的OpenAPI规范的Express服务器不接受嵌套路由'

如何在.npmrc中添加 comments ?

如何使用NodeJS在mongodb中更新文档

FHIR 服务器:尽管 JSON 格式正确,但在 POST 请求中接收未定义请求正文

PM2 是否需要成为其托管项目的依赖项?

Prisma 和 Nextjs:重新部署之前内容不会更新

未授权使用联合身份未授权用户角色从 Amplify graphQL 访问类型 Y 上的 X

Nodejs 从链接数组中获取数据并保存到 mongodb

为什么运行 yarn 命令会出错 - yargs-parser的完整性判断失败

处理 UTC 日期和future

在 Passport 策略回调中获取请求对象

带有加密的nodejs中的SALT和HASH密码

如何在 Node.js 中使用 chmod

已安装全局 NPM 包但未找到命令

TypeError:请求路径包含未转义的字符,我该如何解决这个问题

如何使用 Node.js、Express 和 Mongoose 进行身份验证?

为什么 Node 控制台不显示功能代码?

使用 Node.js 我得到错误:EISDIR,读取

我应该如何在 webpack 中使用时刻时区?

Mongoose - 验证邮箱语法