用于响应的 HTML 解析器 - Java
我使用 HttpClient 访问特定网站,得到的响应是 HTML 形式。我应该使用哪个解析器或方法来解析 HTML 并从响应中获取我想要的内容。 注意:我将 HttpClient 与 Java 一起使用
Im using HttpClient to access a particualr website and the response i get is in the form of an HTML. Which parser or method I should use the parser the HTML and get what I want from the response.
Note: Im using HttpClient with Java
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(3)
使用 jsoup。
Use jsoup.
我会尝试 htmlcleaner 。
您可以将
XPath
与 htmlcleaner 一起使用来获取 xml/html 标记内的内容。这是一个不错的示例 Xpath 示例< /a>
I would give htmlcleaner a try.
You can use
XPath
with htmlcleaner to get contents within xml/html tags.Here is a niceexample Xpath Example
使用 jsoup 和 Java8 的示例代码:
Sample code with jsoup and Java8: