HtmlAgilityPack - 加载页面时如何设置自定义编码
是否可以通过下面的方法在加载页面时设置自定义编码?
HtmlWeb hwWeb = new HtmlWeb();
HtmlDocument hd = hwWeb.load("myurl");
我想将编码设置为“iso-8859-9”。
我使用 C# 4.0 和 WPF。
编辑:问题 已在 MSDN 上回答。
Is it possible to set custom encoding when loading pages with the method below?
HtmlWeb hwWeb = new HtmlWeb();
HtmlDocument hd = hwWeb.load("myurl");
I want to set encoding to "iso-8859-9".
I use C# 4.0 and WPF.
Edit: The question has been answered on MSDN.
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(3)
我想您可以尝试覆盖
HtmlWeb
对象中的编码。试试这个:
注意:
OverrideEncoding
属性似乎已添加到修订版 76610 中的 HTML 敏捷包中,因此它在当前版本 v1.4 (66017) 中不可用。接下来最好的办法是手动读取页面并覆盖编码。I suppose you could try overriding the encoding in the
HtmlWeb
object.Try this:
Note: It appears that the
OverrideEncoding
property was added to HTML agility pack in revision 76610 so it is not available in the current release v1.4 (66017). The next best thing to do would be to read the page manually with the encodings overridden.这是回答的解决方案的简单版本
这里(由于某些原因它被删除了)This is a simple version of the solution answered
here(for some reasons it got deleted)这里有一个不错的答案,它处理自动检测编码以及其他一些漂亮的功能:
C#和HtmlAgilityPack编码问题
A decent answer is over here which handles auto-detecting the encoding as well as some other nifty features:
C# and HtmlAgilityPack encoding problem