不可变数据结构性能

发布于 2024-09-08 20:35:51 字数 208 浏览 14 评论 0原文

我不明白作为一个集合的东西怎么可能是不可变的并且仍然具有可接受的性能。

根据我在 F# Sets 中读到的内容，内部使用红黑树作为其实现。如果每次我们想要向红黑树添加新内容时，我们基本上都必须重新创建它，那么它如何才能具有良好的性能呢？我在这里缺少什么？

尽管我要求 F# 的集合这样做，但我认为这与具有或使用不可变数据结构的任何其他语言一样相关。

谢谢

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

一个人练习一个人 2024-09-15 20:35:52

很简单，集合是基于节点的存储实体。对于集合，您可以将其实现为一棵树，其中当您将元素“添加”到集合的下一个版本时，您不会重新创建所有边和节点，而只是创建一组新的边。您可以这样做，因为节点本身永远不会改变，其中包含的对象也不会改变。

它的真正好处是在单线程应用程序中而不是在多线程应用程序中。不可变的数据结构消除了对锁定机制的需要。如果它们永远不会改变，你就不必担心状态。

回复收藏 0 原文

幸福不弃 2024-09-15 20:35:52

不确定这是如何在语言中实现的，但是数据结构对于程序员来说是不可变的，但可以在幕后进行优化。

例如，我有一个列表 a=[1,2,3,4,5]。我附加 6.b=[a [6]] 并且它们都可以是不可变的。这样做不会损失任何性能，而且比复制值更快。

那么，让我问你，因为我不知道，为什么做不可变的事情会更慢？就树而言，我有点明白你的观点。我猜你必须在当前节点上方重新创建节点，但不能在下方重新创建节点（假设我们有子指针而不是父指针）。

回复收藏 0 原文

对不⑦ 2024-09-15 20:35:51

几乎所有不可变集合都是某种形式的平衡树。要创建新树，您必须重新分配从更改（插入、删除、“更新”）到根的路径上的节点。只要树是平衡的，这就会花费对数时间。如果您有类似 2-3-4 树（类似于红黑树）的预期出度为 3 的树，则只需使用 10 次分配即可处理一百万个元素。

在数据结构被期望是纯粹的语言中，它们确保分配速度很快。分配一个四元素节点将花费一次比较、一次增量和四次存储。在许多情况下，您可以分摊多个分配的比较成本。

如果您想了解有关这些结构如何工作的更多信息，一个很好的来源是 纯函数式数据结构，作者：Chris Okasaki。

回复收藏 0 原文

情释 2024-09-15 20:35:51

您不必重新创建整棵树。许多分支将保持不变并且可以“重复使用”。举一个简单的例子，如果需要将新节点添加到当前树中的叶子中，则只需克隆该节点的父节点并赋予新分支。

回复收藏 0 原文

怂人 2024-09-15 20:35:51

正如其他人指出的那样，您不必重新创建整个数据结构。您只需重新创建已更改的部分并引用保持不变的现有子树。由于数据结构的不变性，您可以重用子树，因此几乎不需要复制所有内容。事实上，如果您很少需要克隆可变数据结构，它可能会产生更大的影响。

特别是，对于平衡树（例如红黑树），这将为您提供：

从集合中添加/删除元素的O(log N)时间（与可变实现相同）
O (log N) 添加/删除元素时的空间（新分配）（可变元素的复杂度为 O(1)）

当然，这对于某些应用程序来说可能开销太大，但实际上并没有那么糟糕。此外，.NET 垃圾收集器中的分配速度非常快（我认为本质上是O(1)），因此这并不是真正的问题。更多的分配意味着 GC 需要更频繁地运行，但这也并不像听起来那么重要 - 如今计算机拥有相当多的内存。 .NET 4.0 实际上在许多情况下都有帮助（另请参阅 Jon Harrop 的此处的答案）