Python 效率：列表与元组

发布于 2024-11-08 05:26:14 字数 208 浏览 0 评论 0原文

我有中等数量的基础物体。

这些基础对象将被放入集合中，并且这些集合将被修改：排序、截断等。

不幸的是，n 足够大，内存消耗有点令人担忧，而且速度也越来越令人担忧。

我的理解是，元组的内存效率稍高一些，因为它们经过了重复数据删除。

无论如何，我想知道 Python 2.6/2.7 中列表与元组的 cpu/内存权衡是什么。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

紫瑟鸿黎 2024-11-15 05:26:14

如果您有一个元组和一个包含相同元素的列表，则元组占用的空间更少。由于元组是不可变的，因此您无法对它们进行排序、添加等。我建议观看 Alex Gaynor 的演讲快速介绍了何时选择 Python 中的数据结构。

更新：再考虑一下，您可能想要研究优化对象的空间使用，例如，通过 < code>__slots__ 或使用 namedtuple 实例作为代理而不是实际物体。这可能会带来更大的节省，因为您有 N 个，并且（大概）只有少数几个集合出现它们。 namedtuple 尤其是超级棒；查看Raymond Hettinger 的演讲< /a>.

回复收藏 0 原文

笨笨の傻瓜 2024-11-15 05:26:14

正如其他人提到的，元组是不可变的。对元组进行排序（例如sorted(mytuple)）会返回一个列表，然后您必须将其转换回元组。

要对元组进行排序（并使其保持元组），您必须执行以下操作：

mytuple = (3,2,1)
mysortedtuple = tuple(sorted(mytuple))

要对列表进行排序，您必须执行以下操作：

mylist = [3,2,1]
mylist.sort()

因为您不是进行强制转换和重新强制转换，所以在本例中，后者是更有效率。

除非你有充分的理由，否则不要沉迷于使用元组而不是列表。如果您需要排序数据，则元组不是最佳选择，除非它们一开始就是这样创建的。当元组包含的数据不会更改时，例如在运行时加载的配置设置或已处理的数据，元组会表现出色。

考虑到您提到您正在处理大型数据集，您可能希望考虑通过列表和元组上的生成器和迭代器来使用函数式编程风格。这样，您就不必四处奔波并创建新容器，而只需链接迭代操作即可获得最终结果。

进一步阅读：

Python 的 itertools
html">Python 函数式编程 HOWTO

As others mentioned tuples are immutable. Sorting a tuple (e.g. sorted(mytuple)) returns a list, which you would then have to cast back to a tuple.

To sort a tuple (and keep it a tuple) you'd have to do this:

mytuple = (3,2,1)
mysortedtuple = tuple(sorted(mytuple))

To sort a list you'd have to do this:

mylist = [3,2,1]
mylist.sort()

Because you're not casting and re-casting, the latter, in this instance, is more efficient.

Don't get hung up on using tuples over lists unless you have a good justification. If you need sorted data, tuples are not the way to go unless they are created that way in the first place. Tuples excel when the data they contain DOES NOT CHANGE, such as with configuration settings that are loaded at run-time, or data that has already been processed.

Considering that you mentioned you are processing a large dataset, you might want to look at using a functional programming style by way of generators and iterators over lists and tuples. This way you're not shuttling around and creating new containers, but just chaining iteration operations to get to the end result.

Further reading:

回复收藏 0 原文

北陌 2024-11-15 05:26:14

集合中基础对象的（平均、最小、最大）数量是多少？

元组是“去重”的，而列表不是？您认为“重复数据删除”在这种情况下意味着什么？

列表确实比元组占用更多的内存，因为额外的内存是在假设列表将会增长的情况下分配的，并且您肯定不希望每次执行large_list.append() 时都重新分配() 内存。然而，在 32 位机器上，额外列表元素的摊销成本为指针 4 个字节、元素本身 N 个字节，以及额外内存不超过 4 个字节。 N 是浮点型的 16 个字节。这意味着浮点数列表每个额外浮点数最多需要 24 个字节，而元组则需要 20 个字节。 N==100 的“基础对象”给出 108 与 104 的比较。如果在两个集合中引用一个基础对象，则为 58 与 54。您的 N 有多大？

建议：将您的收藏保留为列表。专注于：