当前位置：文江博客话题详情

如何删除 HTML CDATA 元素中的标签

发布于 2024-08-25 01:02:32 字数 158 浏览 10 评论 0原文

我在 CDATA 元素中有 HTML（HTML 太糟糕而无法解析），我想删除标签，但保留标签中的文本。

我正在搜索正则表达式，但仍然没有找到一个好方法来做到这一点。

欢迎所有建议！

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

油饼 2024-09-01 01:02:32

您可以通过正则表达式从字符串中删除任何看起来像 HTML 链接的内容。结果在很大程度上取决于您的输入，但是用空字符串替换 ]*> 可能会让您走得很远。

无论如何，使用正则表达式处理 HTML 都是蹩脚且临时的。如果您的输入数据集有限且众所周知，并且您需要做的只是一些一次性转换代码，那么蹩脚和临时的可能就足够了，您可以摆脱它。

如果您正在开发旨在长期存在的代码，那么您绝对应该研究可用的 HTML 解析器之一（BeautifulSoup for Python 或 HTML Agility Pack for .NET 来记住），不仅以结构化的方式处理 HTML，而且还可以在处理时修复它。

回复收藏 0 原文

~没有更多了~

关于作者

装纯掩盖桑

暂无简介

文章

24 人气

关注发私信

忆悲凉

文章 0 评论 0

关注

hgfg1645

文章 0 评论 0

关注

qq_qLPLYi

文章 0 评论 0

关注

戏舞

文章 0 评论 0

关注

殊姿

文章 0 评论 0

关注

﹂绝世的画

文章 0 评论 0

友情链接

文江博客

如何删除 HTML CDATA 元素中的标签

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者