尝试从 HTML 片段中提取文本时遇到问题

发布于 2024-09-12 20:31:11 字数 648 浏览 3 评论 0原文

我正在使用 HTML 敏捷包转换

 <font size="1">This is a test</font>

为

 This is a test

使用此代码：

 HtmlDocument doc = new HtmlDocument();
 doc.LoadHtml(html);
 string stripped = doc.DocumentNode.InnerText;

但我遇到了一个问题：

 <font size="1">This is a test &amp; this is a joke</font>

上面的代码将其转换为

This is a test &amp; this is a joke

但我希望将其转换为：

This is a test & this is a joke

html 敏捷包是否支持我的内容想做什么？为什么 HTML 敏捷代码默认不执行此操作，或者我做错了什么？

原文

i am using the HTML Agility pack to convert

 <font size="1">This is a test</font>

 This is a test

using this code:

 HtmlDocument doc = new HtmlDocument();
 doc.LoadHtml(html);
 string stripped = doc.DocumentNode.InnerText;

but i ran into an issue where i have this:

 <font size="1">This is a test & this is a joke</font>

and the code above converted this to

This is a test & this is a joke

but i wanted it to convert it to:

This is a test & this is a joke

does the html agility pack support what i am trying to do? why doesn't the HTML agiligy code do this by default or i am doing something wrong ?

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

阳光的暖冬 2024-09-19 20:31:11

您可以在输出上运行HttpUtility.HtmlDecode()。

但请注意，InnerText 将包含可能包含在最外层标记内的 HTML 标记。如果您想删除所有标签，则必须遍历文档树并一点一点地检索所有文本。

回复收藏 0 原文

~没有更多了~

关于作者

爱本泡沫多脆弱

暂无简介

文章

24 人气

关注发私信

西西弗的石头怪

文章 0 评论 0

关注

5397313

文章 0 评论 0

关注

烟沫凡尘

文章 0 评论 0

关注

一个破名字

文章 0 评论 0

关注

萌︼了一个春

文章 0 评论 0

关注

当爱已成负担

文章 0 评论 0

友情链接

文江博客

尝试从 HTML 片段中提取文本时遇到问题

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

西西弗的石头怪

5397313

烟沫凡尘

一个破名字

萌︼了一个春

当爱已成负担

友情链接

尝试从 HTML 片段中提取文本时遇到问题

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

西西弗的石头怪

5397313

烟沫凡尘

一个破名字

萌︼了一个春

当爱已成负担

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。