C# HTMLAgilityPack HTML 到文本 - 解析错误
我需要使用 C# 从 HTML 文件中提取文本。 我正在尝试使用 HTMLAgilityPack,但我看到一些解析错误(标签未关闭)。 我正在使用这两个选项:
htmlDoc.OptionFixNestedTags = true;
htmlDoc.OptionAutoCloseOnEnd = true;
是否有任何“修复全部”类型的选项。我不在乎错误,我只想要内容或关闭。
I need to extract text from an HTML file using C#.
I am trying to use HTMLAgilityPack but I am seeing some parse errors (tags not closed).
I am using these two options:
htmlDoc.OptionFixNestedTags = true;
htmlDoc.OptionAutoCloseOnEnd = true;
Is there any "Fix all" type option. I don't care about the errors, I just want the content or close.
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
也许这是解决方法,但一旦我必须从 HTML 中提取文本,我就使用了正则表达式:
Maybe this is workaround but once I had to extract text from HTML I used regex: