文章 0 浏览 6
我已将整个网页的 html 保存到一个字符串中,现在我想从链接中获取“href”值,最好能够稍后将它们保存到不同的字符串中。 最好的方法是什么? 我尝试…
在 Groovy 中,如何抓取网页并删除 HTML 标签等,只留下文档的文本? 我希望将结果转储到一个集合中,以便我可以构建一个词频计数器。 最后,让我再次…
我计划编写一个简单的 J2SE 应用程序来聚合来自多个 Web 源的信息。 我认为,最困难的部分是从网页中提取有意义的信息(如果它不能作为 RSS 或 Atom …
我正在寻找一个库/方法来解析 html 文件,它具有比通用 xml 解析库更多的 html 特定功能。…
我想解析一些 HTML 以便查找某些属性/标签等的值。 您推荐哪些 HTML 解析器? 有什么优点和缺点吗?…
文章 0 评论 0
接受