当前位置：文江博客话题详情

使用 Java 的 DOM XML API 解析 XML 中的 & 符号

发布于 2024-12-09 14:59:14 字数 270 浏览 0 评论 0原文

我正在尝试使用 Java DOM API（不是 SAX）解析 XML 文档。每当解析器在解析文本节点时遇到与号 (&) 时，就会出错。我猜测这可以通过 1）转义、2）编码或 3）使用不同的解析器来解决。

我正在阅读一个我无法控制的 XML 文档，因此每次阅读时我都无法准确识别 & 符号出现在文档中的位置。

我看到的类似问题的答案建议在解析 XML 时替换实体类型，但我不确定如何才能做到这一点，因为它在遇到 XML ＆符号时甚至不会解析。

任何帮助将不胜感激。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

飘逸的'云 2024-12-16 14:59:14

如前所述，XML 格式错误（哎呀！）：XML 中出现的所有 &（引入字符实体 [?] 的标记除外）都必须编码为 &。。

一些解决方案（基本上就像帖子中所描述的那样！）：

修复 XML（在源代码处或在 hack-it-up 阶段），或者；
使用“适当的”工具（例如“宽容的”HTML 解析器）对其进行解析

对于“hack-it-up”方法，请考虑单独的输入流 - 请参阅使用过滤器流——在实际 DOM 解析器之前作为过滤器执行: 每当遇到 & （不是字符实体的一部分），它通过将 & 插入流中来“修复它”。当然，如果 XML 源代码的基本编码不正确……

祝您编码愉快。

回复收藏 0 原文

逆光飞翔i 2024-12-16 14:59:14

“我正在阅读一个我无法控制的 XML 文档”。

不，您正在阅读非 XML 文档。收到错误的原因是，当您读取非 XML 内容时，XML 解析器需要给您一个错误。

XML 文化认为，生成格式良好的 XML 的责任在于发送者。您需要更改生成此数据的任何内容才能正确执行此操作。否则，您可能会忘记 XML 及其优点，而回到私有协议和自定义解析器的混乱世界。

回复收藏 0 原文

~没有更多了~

关于作者

野の

暂无简介

0 文章

0 评论

23 人气

关注发私信

友情链接

文江博客

使用 Java 的 DOM XML API 解析 XML 中的 & 符号

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

已经忘了多久

15867725375

LonelySnow

走过海棠暮

轻许诺言

信馬由缰

友情链接

使用 Java 的 DOM XML API 解析 XML 中的 & 符号

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

已经忘了多久

15867725375

LonelySnow

走过海棠暮

轻许诺言

信馬由缰

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。