解析任何原始 HTML 的内置方法

发布于 2025-01-02 15:53:11 字数 466 浏览 2 评论 0原文

我开始编写一个应用程序，该应用程序应该从任何指定的 HTML 页面检索元标记内容。由于我使用 .NET 2.0 来实现此目的，因此我无法使用 LINQ to XML 或现代的东西。因此，我尝试使用 XmlDocument 类。不幸的是，它无法处理无效的 XML 文档，而大多数 HTML 文档都是如此。

我什至无法使用 HtmlAgilityPack，因为我正在编写计划将来出售的应用程序，因此它可能不适合商业需求。

使用 XmlReader 似乎太难了。

那么，你们将如何解决这个问题？

POST EDIT

我最好避免使用 HtmlAgilityPack 的另一个原因是，它是一个巨大的库，需要添加到我的项目中。我会更乐意将项目保持得尽可能小。

你们真的建议我使用 HtmlAgilityPack 吗？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

不如归去 2025-01-09 15:53:11

我什至无法使用 HtmlAgilityPack 因为我正在编写我计划的应用程序
将来要出售，所以可能不符合商业需求。

HtmlAgilityPack 使用 Microsoft 公共许可证 (Ms-PL)，这将允许您在商业产品，它非常自由 - 另请参阅“MS-PL 许可证如何工作吗？” 和 Microsoft 公共许可证 (Ms-PL)

回复收藏 0 原文

橘和柠 2025-01-09 15:53:11

HtmlDocument doc = new System.Windows.Forms.WebBrowser().Document.OpenNew(true);
doc.Write("<HTML><BODY>This is a new HTML document.</BODY></HTML>");

请参阅 MSDN。

请注意，这是一个 WebForms 控件，您可能会在 WebForms 应用程序之外运行它时遇到不同的问题。

HtmlDocument doc = new System.Windows.Forms.WebBrowser().Document.OpenNew(true);
doc.Write("<HTML><BODY>This is a new HTML document.</BODY></HTML>");

See MSDN.

Note that this is a WebForms control, you may face different issues running it out of WebForms app.

回复收藏 0 原文

~没有更多了~

关于作者

月寒剑心

暂无简介

文章

26 人气

关注发私信

卷耳

文章 0 评论 0

关注

佚名

文章 0 评论 0

关注

℉服软

文章 0 评论 0

关注

qq_2gSKZM

文章 0 评论 0

关注

凉宸

文章 0 评论 0

关注

gyhjy

文章 0 评论 0

友情链接

文江博客

解析任何原始 HTML 的内置方法

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

卷耳

佚名

℉服软

qq_2gSKZM

凉宸

gyhjy

友情链接

解析任何原始 HTML 的内置方法

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

卷耳

佚名

℉服软

qq_2gSKZM

凉宸

gyhjy

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。