通过xslt清理xml中的CDATA

发布于 2024-10-20 18:30:20 字数 467 浏览 10 评论 0原文

我正在尝试将来自 Wordpress 的 RSS 2 转换为 XHTML 1.0 Strict（使用 cronjob 和 xsltproc）；但是，Wordpress 会在 summary 元素末尾的 CDATA 中插入 img。 img 有一个 border 属性，该属性在 XHTML 1.0 Strict 中无效。因为它是 CDATA，所以我认为这意味着我无法将它与我的 XSLT 匹配。我可以肯定地说，img 始终是 CDATA 结束之前的最后一件事。我更愿意删除 border 属性并保留图像，但我宁愿完全删除该元素，也不愿使用无效的标记。

是否可以使用 XSLT（或许使用字符串表达式）在 CDATA 内进行匹配？如果是这样，这是正确的方法吗？还是有更好的解决方案？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

青巷忧颜 2024-10-27 18:30:20

请记住 CDATA 的含义：“字符数据”。将某些内容放入 CDATA 中意味着：这可能看起来像标记，但我不希望您将其视为标记。因此，如果 CDATA 中的内容看起来像一个 img 元素，那么 CDATA 会告诉您不要被愚弄 - 它根本不是一个元素。话虽如此，您当然可以像处理任何其他字符串一样处理文本，包括将其传递到 XML 解析器以将其转换为节点树。

回复收藏 0 原文