当前位置：文江博客话题详情

.Net 中是否有与 HTML 等效的 XmlReader？

发布于 2024-11-16 22:51:54 字数 340 浏览 4 评论 0原文

我过去曾使用 HtmlAgilityPack 来解析 .Net 中的 HTML，但我不这样做不喜欢它只使用 DOM 模型这一事实。

在大型文档和/或具有大量嵌套的文档上，可能会遇到堆栈溢出或内存不足异常。另外，一般来说，基于 DOM 的解析模型比基于流的方法使用更多的内存，通常是因为想要使用 HTML 的进程可能一次只需要几个可用元素。

有谁知道 .Net 有一个不错的 HTML 解析器，它允许您以类似于 XmlReader 类的方式解析 HTML？即以仅向前流的方式

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

毁梦 2024-11-23 22:51:54

我通常使用 SgmlReader 来实现此目的： https://github.com/MindTouch/SGMLReader

正如其他人所说，存在一些问题，因为 HTML 不遵循与 XML 相同的格式良好的规则，因此它本质上很难解析，但 SgmlReader 通常可以做得很好。

回复收藏 0 原文

只为守护你 2024-11-23 22:51:54

问题是 HTML 可能格式错误。在解析文档的大部分之前，您无法知道哪个标记缺少结束标记（或者哪些标记放置的顺序不正确）。

如果您要解析的文档格式良好，为什么不使用 XmlReader 呢？

回复收藏 0 原文

~没有更多了~

关于作者

屋顶上的小猫咪

暂无简介

文章

25 人气

关注发私信

Promise

文章 0 评论 0

关注

qq_lbRlsh

文章 0 评论 0

关注

待＂谢繁草

文章 0 评论 0

关注

yy2010hell

文章 0 评论 0

关注

漫无边际

文章 0 评论 0

关注

傲娇萝莉攻

文章 0 评论 0

友情链接

文江博客

.Net 中是否有与 HTML 等效的 XmlReader？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签