当前位置：文江博客话题详情

HTML String parsing document Java

Java 解析器 HTML 使用纯字符串方法？

发布于 2025-01-08 07:24:52 字数 254 浏览 3 评论 0原文

这是个好主意吗？嗯，我使用过其他第 3 方库，如 JSoup，它工作得很好，但对于这个项目来说它是不同的。当您只想从中获取一项时，加载和解析整个文档是否值得？有些html页面也很简单，所以我也可以使用String方法。原因是内存会成为一个问题，并且加载文档也需要一些时间。解析 XML 时，我总是使用 SAX 解析器，因为它不会将其加载到内存中，而且速度很快。我可以在 html 文档上使用同样的东西吗？或者已经有这样的东西了吗？因此，如果有一个非 DOM HTML 轻量级解析器，那就太好了。

收藏 0

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

评论（1）

も让我眼熟你 2025-01-15 07:24:52

如果 HTML 符合 XML（即 XHTML），那么您可以使用标准 SAX 解析器。在这里您可以找到 Java 中的 HTML 解析器列表以供选择： http://java- source.net/open-source/html-parsers。 HotSax 可能会处理您的所有用例。

回复收藏 0 原文

~没有更多了~

关于作者

暂无简介

文章

评论

26 人气

关注发私信

相关话题

热门标签

操作系统程序设计 IT运维 Linux系统管理 JavaScript 服务器应用 solaris C/C++ PHP Shell BSD Vue.js aix Oracle Python HTML 系统管理 HTML5 CSS 前端

推荐作者

冰之心

文章 0 评论 0

貪欢

文章 0 评论 0

好菇凉咱不稀罕他

文章 0 评论 0

guowei007

文章 0 评论 0

大海や

文章 0 评论 0

1KUPGZrJCxEwZ

文章 0 评论 0

友情链接

我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的隐私政策了解更多相关信息。单击 接受 或继续使用网站，即表示您同意使用 Cookies 和您的相关数据。

原文