为了账号安全,请及时绑定邮箱和手机立即绑定

如何使用Node.js解析HTML页面

如何使用Node.js解析HTML页面

慕桂英3389331 2019-10-08 11:01:54
我需要解析(服务器端)大量的HTML页面。我们都同意,regexp不是行之有效的方法。在我看来,javascript是解析HTML页面的本机方式,但是这种假设取决于服务器端代码,该代码具有javascript在浏览器内部具有的所有DOM功能。Node.js是否具有内置的功能?有没有更好的方法来解决此问题,请在服务器端解析HTML?
查看完整描述

4 回答

?
HUH函数

TA贡献1836条经验 获得超4个赞

使用Cheerio。它不像jsdom那样严格,并且针对抓取进行了优化。另外,使用您已经知道的jQuery选择器。


❤熟悉的语法:Cheerio实现了核心jQuery的子集。Cheerio从jQuery库中消除了所有DOM不一致和浏览器残骸,从而揭示了其真正华丽的API。


ϟ快速发展:Cheerio使用非常简单,一致的DOM模型工作。结果,解析,操作和渲染都非常高效。初步的端到端基准测试表明,cheerio比JSDOM快8倍。


flexible非常灵活:Cheerio将@ FB55宽容的htmlparser环绕起来。Cheerio可以解析几乎任何HTML或XML文档。


查看完整回答
反对 回复 2019-10-08
  • 4 回答
  • 0 关注
  • 2204 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信