当前位置：文江博客话题详情

使用 perl 处理大型 xml 文件

发布于 2024-10-17 18:56:40 字数 281 浏览 4 评论 0原文

我有一个大约 200MB 大小的 XML 文件，我希望逐行提取选定的信息。

我用 perl 编写了一个脚本，使用模块 XML::LibXML 来解析文件内容，然后循环内容并逐行提取信息。这是无效的，因为它将整个文件读入内存，但我喜欢 LibXML，因为我可以使用所需信息的 XPath 位置。

我可以获得有关如何使我的代码更有效的建议吗？

通过搜索，我已经了解了 XML::SAX 和 XML::LibXML::SAX，但我找不到解释其用法的文档，而且它们似乎不包含任何类型的 XPath 寻址结构。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

ぇ气 2024-10-24 18:56:40

您是否考虑过 XML::Twig 模块，它对于大文件效率更高处理，如 CPAN 模块描述中所述：

NAME

XML::Twig - 一个 Perl 模块
处理巨大的 XML 文档
树模式。

概要

...
它允许最少的资源（CPU 和
内存）通过构建树来使用
仅适用于文档的部分内容
需要实际处理的，通过
twig_roots 的使用和
twig_print_outside_roots 选项。
...

回复收藏 0 原文

桃酥萝莉 2024-10-24 18:56:40

我在 XML::Twig 方面运气不错，但最终得到了 XML::LibXML::Reader 速度更快...如果您需要使用 XPath，您还可以检查 XML::LibXML::Pattern。

回复收藏 0 原文

~没有更多了~

关于作者

不甘平庸

暂无简介

0 文章

0 评论

24 人气

关注发私信

Gabu-gabumon

文章 0 评论 0

关注

qq_CgiN62

文章 0 评论 0

关注

荔枝明

文章 0 评论 0

关注

赏烟花じ飞满天

文章 0 评论 0

关注

独守阴晴ぅ圆缺

文章 0 评论 0

关注

¤→小豸慧

文章 0 评论 0

友情链接

文江博客

使用 perl 处理大型 xml 文件

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签