用于处理无效 XML 的 .NET 解析器
我需要从第三方源读取一些 XML。它们的文本字段都没有包含在 CDATA 标记中,并且它们不能保证这些值不会包含无效字符——我特别想到的是 & 符号。他们也不会添加 CDATA 标签,因为这可能会破坏现有客户的情况。有没有一个解析器可以处理这个问题?
I need to read some XML from a 3rd party source. None of their text fields are wrapped in CDATA tags, and they can't guarantee that the values won't include invalid characters--I'm particularly thinking of ampersands. They also won't add CDATA tags, because that might break things for their existing clients. Is there a parser out there that would handle this?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
假设无效字符被正确转义,而不是按字面意思包含在 XML 中,您可以通过创建一个将 Normalization 属性设置为 false 的 XmlTextReader,使用 .NET 库来读取它。请参阅 http://msdn.microsoft.com/en-我们/library/system.xml.xmltextreader.normalization.aspx
Assuming the invalid characters are properly escaped, not included literally in the XML, you can read it with the .NET library by creating an XmlTextReader with the Normalization property set to false. See http://msdn.microsoft.com/en-us/library/system.xml.xmltextreader.normalization.aspx