Java 推荐哪些 HTML 解析库
我想解析一些 HTML 以便查找某些属性/标签等的值。
您推荐哪些 HTML 解析器? 有什么优点和缺点吗?
I want to parse some HTML in order to find the values of some attributes/tags etc.
What HTML parsers do you recommend? Any pros and cons?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(3)
您需要对 HTML 进行完整解析吗? 如果您只是在内容中查找特定值(特定标签/参数),那么一个简单的正则表达式可能就足够了,而且可能会更快。
Do you need to do a full parse of the HTML? If you're just looking for specific values within the contents (a specific tag/param), then a simple regular expression might be enough, and could very well be faster.
我尝试过 HTML Parser 这非常简单。
I have tried HTML Parser which is dead simple.
NekoHTML,TagSoup 和 JTidy 将允许您可以解析 HTML,然后使用 XML 工具(例如 XPath)进行处理。
NekoHTML, TagSoup, and JTidy will allow you to parse HTML and then process with XML tools, like XPath.