当前位置：文江博客话题详情

解码所有 HTML 实体

发布于 2024-12-19 03:15:35 字数 223 浏览 2 评论 0原文

我正在寻找一些可以解码大量 HTML 实体的函数。

原因是我正在编写一些代码来获取 HTML 内容并将其转换为纯文本，我遇到的问题是很多实体无法使用 HttpUtility.HtmlDecode。

我关心的实体的一些示例是  、&、©。

这是针对 .net 3.5 的。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

活泼老夫 2024-12-26 03:15:35

那么也许您需要HttpUtility.HtmlDecode？。
它应该可以工作，您只需要添加对 System.Web 的引用。
至少在 .Net Framework 中是这样的4.

例如以下代码：

MessageBox.Show(HttpUtility.HtmlDecode("&©"));

工作正常，输出符合预期（与号和版权符号）。
您确定问题出在 HtmlDecode 中而不是其他地方吗？

更新：另一个能够完成这项工作的类，WebUtility（又是 HtmlDecode 方法）出现在较新版本的 .Net 中。然而，它似乎存在一些问题。请参阅 HttpUtility 与 WebUtility 问题。

Then maybe you will need the HttpUtility.HtmlDecode?.
It should work, you just need to add a reference to System.Web.
At least this was the way in .Net Framework < 4.

For example the following code:

MessageBox.Show(HttpUtility.HtmlDecode("&©"));

Worked and the output was as expected (ampersand and copyright symbol).
Are you sure the problem is within HtmlDecode and not something else?

UPDATE: Another class capable of doing the job, WebUtility (again HtmlDecode method) came in the newer versions of .Net. However, there seem to be some problems with it. See the HttpUtility vs. WebUtility question.

回复收藏 0 原文

如痴如狂 2024-12-26 03:15:35

使用 .Net 4 中包含的 WebUtility.HtmlDecode

例如，如果我在控制台应用程序中运行：

  Console.WriteLine(WebUtility.HtmlDecode(" , &, ©"));

我会得到 , &, c

Use WebUtility.HtmlDecode included in .Net 4

For example, if I run in a console app:

  Console.WriteLine(WebUtility.HtmlDecode(" , &, ©"));

I get , &, c

回复收藏 0 原文

~没有更多了~

关于作者

心意如水

暂无简介

文章

28 人气

关注发私信

友情链接

文江博客

解码所有 HTML 实体

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

眼泪淡了忧伤

corot39

守护在此方

github_3h15MP3i7

相思故

滥情空心

友情链接

解码所有 HTML 实体

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

眼泪淡了忧伤

corot39

守护在此方

github_3h15MP3i7

相思故

滥情空心

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。