当前位置：文江博客话题详情

如何解析不是 100% 有效的 XHTML 文件？

发布于 2024-07-19 08:58:37 字数 191 浏览 9 评论 0原文

我有 XHTML 文件，其来源不完全有效，它不遵循 XML 文档的 DTD。

就像有些地方对于 " 使用 &Idquo; 或对于撇号它使用 ’。这会导致我的 C# 出现异常那么

有什么方法或任何网络链接可以用来摆脱这个问题吗？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

眼泪淡了忧伤 2024-07-26 08:58:37

如果文件格式良好，您可以在自己的 DTD 中定义字符实体。

如果文件格式不正确，CodePlex 中的 HTML Agility Pack 将对其进行解析。

回复收藏 0 原文

独夜无伴 2024-07-26 08:58:37

您可以将文档解析为 HTML，因为它们最终都会以 DOM 和 HTML 形式出现解析器嘲笑这些三色堇引号问题。按照unknown 的 HTML Tidy 想法，您可以将 DOM 序列化回有效的 XHTML 文件。（这与使用 HTML Tidy 相同，无论如何都可能使用 HTML 解析器，除非您通过 C# 编程来执行此操作。）

回复收藏 0 原文