转换“&”正在发生;” ”&乌姆尔;”到其正常表示
我正在加载网页 System.Net.WebClient
。页面采用 ISO-8859-1
编码。 如果我将其写入文件然后打开,我可以正常看到所有字符。
但是如果我将此内容放入 HtmlAgilityPack 中,然后提取 innerText 属性, 我收到一些特殊字母,编码为 å
和 ö
。
如何将它们转换为正常表示?
I'm loading a web page System.Net.WebClient
. Page is in ISO-8859-1
encoding.
If I write it to file and then open, I can see all characters normally.
But if I put this content into HtmlAgilityPack and then extract innerText property,
I'm getting some special letter encoded as å
and ö
.
How to convert them to normal representation?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(2)
使用
HttpUtility.HtmlDecode
方法Use the
HttpUtility.HtmlDecode
method您可以使用文本字符串作为参数来调用
HtmlEntity.DeEntitize
方法。You can call the
HtmlEntity.DeEntitize
method with the text string as the parameter.