当前位置：文江博客话题详情

使用jpedal从html中提取超链接？ --java

发布于 2024-12-08 12:22:08 字数 210 浏览 0 评论 0原文

java中的JPedal库通常用于将pdf转换为XML或HTML。但是，我需要知道我们是否可以使用 JPedal 库 API 从 HTML5 文档中提取数据并将其保存为 XML？除此之外还有其他可能的替代方案吗？

另外，我正在尝试使用 Java 解析 HTML5 文档并将其存储在 XML 中。有没有什么好的解决方案可以找到特定的标签并从中呈现 XML？

请告诉我。谢谢。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

悍妇囚夫 2024-12-15 12:22:08

有许多 Java HTML 解析器，但我建议使用 validator.nu 的 HTML5 解析器，可从此处下载： http://about.validator.nu/htmlparser/。

由 HTML5 的主要主角之一、Mozilla 的 Henri Sivonen 编写，用于使用 HTML5 解析器算法，您不会找到更可靠的 HTML 解析器，它创建了一个真正的 DOM，可以使用标准 XML 工具进行操作，并使用以下命令查询超链接： X 路径。有一些示例说明如何使用 XSLT 转换以及如何获取创建的 DOM 的 XML 序列化。

回复收藏 0 原文

~没有更多了~