当前位置：文江博客话题详情

如何使用 html Agility Pack 进行 htmlencode？

发布于 2024-07-06 12:02:33 字数 237 浏览 8 评论 0原文

有人这样做过吗？基本上，我想通过保留 h1、h2、em 等基本标签来使用 html；清理img和a标签中的所有非http地址；并对所有其他标签进行 HTMLEncode。

我被困在 HTML 编码部分。我知道要删除节点，您可以执行“node.ParentNode.RemoveChild(node);” 其中node是HtmlNode类的对象。不过，我不想删除该节点，而是想对其进行 HTMLEncode。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

尾戒 2024-07-13 12:02:33

您需要删除代表您不需要的元素的节点。然后需要将编码的 HTML 作为文本节点重新添加。

如果您不想处理要丢弃的元素的子元素，您应该能够只使用 OuterHtml ...这样的方法可能会起作用：

node.AppendChild(new HtmlTextNode { Text = HttpUtility.HtmlEncode(nodeToDelete.OuterHtml) });

You would need to remove the node representing the element you don't want. The encoded HTML would then need to be re-added as a text node.

If you don't want to process the children of the elements that you want to throw away, you should be able to just use OuterHtml ... something like this might work:

node.AppendChild(new HtmlTextNode { Text = HttpUtility.HtmlEncode(nodeToDelete.OuterHtml) });

回复收藏 0 原文

顾铮苏瑾 2024-07-13 12:02:33

上面的答案几乎涵盖了它。不过，有一点需要补充。

您不想更改特定节点，而是更改所有节点，因此上面的代码可能是一个方法，包含在 if 语句中（以确保它是您想要 HtmlEncode 的标签）。更重要的是，由于 Agility Pack 不按序数公开节点，因此您无法迭代整个文档。递归是最简单的方法。您可能已经知道这一点...

我解决了类似的问题，并且有一些 shell 代码（C#），非常欢迎您使用：http://dev.forrestcroce.com/normalizer-of-web-pages-qualifier-of-urls/2008- 12-09/

回复收藏 0 原文

~没有更多了~

关于作者

我很OK

暂无简介

0 文章

0 评论

23 人气

关注发私信

友情链接

文江博客

如何使用 html Agility Pack 进行 htmlencode？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

qq_FjTq5B

18273202778

WordPress小学生

〃温暖了心ぐ

迷乱花海

niuniu

友情链接

如何使用 html Agility Pack 进行 htmlencode？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

qq_FjTq5B

18273202778

WordPress小学生

〃温暖了心ぐ

迷乱花海

niuniu

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。