使用 HTMLAgilityPack 解析并非来自 URL 的 HTML 字符串
我正在尝试获取通过 vb.net 代码标记的字符串,并将其与最初来自的文本文件进行交叉检查。这是为了校对 html 输出。
为此,我需要解析不是来自 URL 的 HTML 片段。
我见过的 HTMLAgilityPack 示例从 URL 获取输入。有没有一种方法可以解析不包含标题或格式良好的网页的类似部分的标记文本字符串?
谢谢
I am trying to take a string that I have marked up through vb.net code and cross-check it with the text file it came from originally. This is for proofreading the html output.
To do this, I need to parse an HTML snippet that does not come from a URL.
The examples of HTMLAgilityPack I have seen get their input from a URL. Is there a way to parse a string of marked-up text that does not include a header or similar parts of a well-formed webpage?
Thanks
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(2)
要解析包含 HTML 片段而不是文件或 URL 的字符串,您可以按照 @Oded 的建议使用 HtmlDocument,但不要使用 doc.Load(),而是使用 doc.LoadHtml()。
To parse a string containing an HTML snippet rather than a file or URL, you can use the HtmlDocument as @Oded suggested, but instead of using doc.Load(), use doc.LoadHtml().
使用
HtmlDocument
代替WebDocument
:它是 HAP 示例页面。
Instead of the
WebDocument
useHtmlDocument
:It is the first thing on the HAP examples page.