当前位置：文江博客话题详情

XML 解析：元素树 (etree) 与 minidom

发布于 2024-12-14 01:13:57 字数 202 浏览 4 评论 0原文

我多年来一直使用 minidom 来解析 XML。现在我突然了解了元素树。我的问题哪个解析更好？即：

哪个更快？
哪个使用更少的内存？
是否有我应该担心的 O(n^2) 依赖性？
一件物品是否因另一件物品而贬值？

为什么我们有两个接口？

谢谢。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

诗化ㄋ丶相逢 2024-12-21 01:13:57

用于 XML 解析的 DOM 和 Sax 接口是使用 XML 的经典方法。 Python 必须提供这些接口，因为它们是众所周知的且标准的。

ElementTree 包旨在提供更具 Python 风格的界面。这一切都是为了让程序员的事情变得更容易。

根据您的构建，它们中的每一个都有一个底层 C 实现，使它们运行得更快。

上述工具均未被弃用。它们各有优点（例如，Sax 不需要将整个输入读取到内存中）。

还有一个名为 lxml 的第三方模块，它也是一个流行的选择（功能齐全且速度快）。

回复收藏 0 原文

安人多梦 2024-12-21 01:13:57

Python 有两个接口，可能是因为 Element Tree 在 minidom 出现后很久才被集成到标准库中。其原因可能是与 W3C 控制的 DOM 相比，它的 API 更加“Pythonic”。

如果您关心速度，还有 lxml，它使用 libxml2 构建与 ElementTree 兼容的 DOM，并且应该相当快– 他们有一个基准套件，将自己与 ElementTree 的 Python 和 C 实现进行比较。

如果您担心内存使用，无论如何您都不应该使用树 API； PullDOM 可能是一个更好的选择，但我是根据使用 Java 优秀的 pull 解析器的经验进行推断的 - 目前似乎没有太多关于 PullDOM 的信息。

回复收藏 0 原文

~没有更多了~

关于作者

恋你朝朝暮暮

暂无简介

文章

506 人气

关注发私信

友情链接

文江博客

XML 解析：元素树 (etree) 与 minidom

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

诺曦

要走干脆点

把回忆走一遍

陌上青苔

Arthur

哄哄

友情链接

XML 解析：元素树 (etree) 与 minidom

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

诺曦

要走干脆点

把回忆走一遍

陌上青苔

Arthur

哄哄

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。