当前位置：文江博客话题详情

CharacterData 忽略非转义字符

发布于 2024-11-15 14:51:26 字数 427 浏览 0 评论 0原文

我正在使用以下方法通过网络从 XML 文档中读取一行文本：

public static String getCharacterDataFromElement(Element e) {
    Node child = ((Node) e).getFirstChild();
    if (child instanceof CharacterData) {
        CharacterData cd = (CharacterData) child;
        return cd.getData();
    }
    return "";
}

它工作正常，但如果遇到像 & 符号这样的字符，而它的写法不像 &< /code> 等它将完全忽略该字符和该行的其余部分。我可以做什么来纠正这个问题？

I'm using the following method to read in a line of text from an XML document via the web:

public static String getCharacterDataFromElement(Element e) {
    Node child = ((Node) e).getFirstChild();
    if (child instanceof CharacterData) {
        CharacterData cd = (CharacterData) child;
        return cd.getData();
    }
    return "";
}

It works fine, but if it comes across a character such as an ampersand which are not written like & etc it will then completely ignore that character and the rest of the line. What can I do to rectify this?

收藏 0

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

评论（2）

难如初 2024-11-22 14:51:26

唯一正确的解决方案是更正 XML，将 & 写为 &，或者将文本包裹在 ... ]]>。

它实际上不是 XML，除非您转义 & 符号或使用 CDATA。

回复收藏 0 原文

嘦怹 2024-11-22 14:51:26

我怀疑有关输入格式不正确的说法是在转移注意力。如果源文档包含实体引用，则一个元素可能包含多个文本节点子节点，并且您的代码仅读取其中的第一个。它需要阅读所有这些内容。

（我认为有更简单的方法可以获取 DOM 中节点的文本内容。但我不确定，如果可以避免的话，我从不使用 DOM，因为它让一切变得如此困难。使用 JDOM 会更好或 XOM。）

回复收藏 0 原文

~没有更多了~

关于作者

暂无简介

0 文章

0 评论

22 人气

关注发私信

相关话题

热门标签

操作系统程序设计 IT运维 Linux系统管理 JavaScript 服务器应用 solaris C/C++ PHP Shell BSD Vue.js aix Oracle Python HTML 系统管理 HTML5 CSS 前端

推荐作者

‘画卷フ

文章 0 评论 0

寂寞清仓

文章 0 评论 0

脸赞

文章 0 评论 0

WeiBestSmart

文章 0 评论 0

娇女薄笑

文章 0 评论 0

国粹

文章 0 评论 0

友情链接

我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的隐私政策了解更多相关信息。单击 接受 或继续使用网站，即表示您同意使用 Cookies 和您的相关数据。

原文