当前位置：文江博客话题详情

解码 XML 中的扩展字符

发布于 2024-08-17 06:42:35 字数 513 浏览 2 评论 0原文

我知道这可能很简单并且之前可能已经被问过，但我很难找到解决方案。

我正在解析一些 RSS 提要，其中包含 HTML 作为 CDATA 块。一个示例如下：http://g.msn.com/1ewenus50/news2

变化很大，但里面几乎总是有一些扩展的字符。例如，如果我制作一个简单的控制台应用程序并使用 WebClient.DownloadString 并查看结果，我会看到类似

“在圣诞节当天飞行途中获悉涉嫌未遂 253 航班轰炸机的极端主义链接。NBC” ™s Savannah Guthrie 报道。（今日秀）”

然而，那些奇怪的字符应该是撇号、引号、破折号等。

让这些正确解码的技巧是什么？

如果还不清楚，我将使用 C# / .NET 来实现此目的。最后，此内容将在 Silverlight 中呈现，但我也在完整的 .NET 3.5 运行时中看到了该问题。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

小矜持 2024-08-24 06:42:35

以二进制形式下载并将其解析为 XML。应该是正确的 - XML 文档应该在编码方面是自我描述的，但我不会将它放在某些网络服务器上以将其（在标头中）宣传为具有不同的编码，这会让 DownloadString 感到困惑。

一般来说，当涉及 XML 时，值得在 XML API 中尽可能多地进行操作，而不是使用原始数据。

回复收藏 0 原文

苏大泽ㄣ 2024-08-24 06:42:35

您可能使用了错误的文本编码...我不确定您使用的是哪一种或哪一种是正确的，但这可能会让您走上正轨。

回复收藏 0 原文

~没有更多了~

关于作者

铜锣湾横着走

暂无简介

0 文章

0 评论

22 人气

关注发私信

ni139999

文章 0 评论 0

关注

Smile

文章 0 评论 0

关注

木子李

文章 0 评论 0

关注

仅此而已

文章 0 评论 0

关注

qq_2gSKZM

文章 0 评论 0

关注

内心激荡

文章 0 评论 0

友情链接

文江博客

解码 XML 中的扩展字符

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签