当前位置：文江博客话题详情

XML encoding

非法字符导致 xml 解析错误

发布于 2024-09-07 13:44:36 字数 406 浏览 2 评论 0 原文

所以，我问这是最后的手段，因为我完全没有想法。

我有一个 Windows ASP.NET ASMX Web 服务应用程序，它返回一个带有 -- 的序列化 Person 对象姓名、地址、电子邮件...等，

但 xml 中的某些属性编码非常奇怪，例如 - &#x1a （我不知道编码发生在哪里。我假设在序列化过程中)

谷歌搜索这些字符我发现它是“Windows-1252”编码。

问题发生在解析XML的过程中，我发现在1252编码的位置出现了“无效的unicode字符”的解析错误。

我怎样才能成功解析它？您建议什么解决方案？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

薄情伤 2024-09-14 13:44:36

解析器是正确的，无论产生什么序列化都是错误的。与大多数 C0/C1 控制字符一样，放置 U+001A SUBSTITUTE 到 XML 1.0 文件 (*)，即使编码为字符引用，例如。

XML 解析器不会也不应该读取此内容。虽然您可以在将序列传递给解析器之前尝试过滤掉一些可怕的 hack，但这种粗暴的 hack 不适用于一般情况。应修复串行器以停止生成它们。

实际上，我不知道该字符（通常用于在古老的可怕操作系统中标记文件结尾）如何进入 ASP.NET 应用程序使用的数据集，但它似乎在姓名、地址或电子邮件。也许您确实需要考虑清理数据。

（*：如果在 XML 1.1 文档中编码为字符引用，则这是合法的。如果绝对必须通过 XML 来回控制字符，则必须使用 XML 1.1。尽管这可能会导致与旧版 XML 解析器的兼容性问题，并且您仍然不能使用 U+0000 NULL 字符，因此您永远不会完全是二进制安全的。）

回复收藏 0 原文

~没有更多了~

关于作者

只有影子陪我不离不弃

暂无简介

0 文章

0 评论

22 人气

关注发私信

内心激荡

文章 0 评论 0

关注

JSmiles

文章 0 评论 0

关注

赏烟花じ飞满天

文章 0 评论 0

关注

左秋

文章 0 评论 0

关注

迪街小绵羊

文章 0 评论 0

关注

瞳孔里扚悲伤

文章 0 评论 0

友情链接

文江博客

非法字符导致 xml 解析错误

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者