当前位置：文江博客话题详情

使用 Perl 解析损坏的 RSS 提要

发布于 2024-09-07 03:08:38 字数 264 浏览 4 评论 0原文

我希望能够解析包含以下内容的 RSS 和 Atom 提要无效的 XML。我遇到并想要修复的错误包括“简单”的东西，例如 &gt ，其中结束 ; 是缺失、缺失结束标签以及出现在错误的顺序。

我想忽略理论上它是否会产生任何影响的问题尝试解析格式错误的 XML 文档根本没有意义。一 “技术”术语似乎与我想做的事情相当接近是“标签汤”。我应该使用哪些现有的 CPAN 模块来构建这样的能够容忍或纠正此类简单错误的解析器如上所述？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

只想待在家 2024-09-14 03:08:38

recover 标志为 LibXML ，如果你真的必须这样做，或者 XML-Liberal 如果你真的想太过分在解析任何旧垃圾时。

我确信您想忽略解析非格式良好的文档是否有意义的问题，但忽略它并不会让它消失。大多数 RSS 工具会正确地完全拒绝任何格式不正确的 XML 输入；通常你应该效仿，除非你的工具是不寻常的东西，比如 RSS 调试器。

“标签汤”是一个专门与 HTML 解析相关的术语。 XML（以及 RSS 和 Atom）的中心思想之一是不存在这样的东西。

回复收藏 0 原文

~没有更多了~

关于作者

ゝ偶尔ゞ

暂无简介

0 文章

0 评论

23 人气

关注发私信

友情链接

文江博客

使用 Perl 解析损坏的 RSS 提要

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

巷子口的你

微信用户

神妖

鞋纸虽美，但不合脚ㄋ〞

7460852697

ligengkai

友情链接

使用 Perl 解析损坏的 RSS 提要

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

巷子口的你

微信用户

神妖

鞋纸虽美，但不合脚ㄋ〞

7460852697

ligengkai

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。