我使用htmldoc已经有一段时间了,但我遇到了一些相当严重的限制.我需要最终的解决方案来在Linux机器上工作.我将从Perl应用程序调用这个库/实用程序/应用程序,因此任何Perl接口都是一个额外的功能.
我使用htmldoc已经有一段时间了,但我遇到了一些相当严重的限制.我需要最终的解决方案来在Linux机器上工作.我将从Perl应用程序调用这个库/实用程序/应用程序,因此任何Perl接口都是一个额外的功能.
注意:这个答案是2008年的,现在可能不正确;请判断其他答案
PrinceXML是我见过的最好的一个(它解析常规HTML以及XML/XHTML).怎样才是最好的?我觉得这真是太令人印象深刻了
然而,它相当昂贵