哈希表运行时复杂性（插入、搜索和删除）

发布于 2025-01-03 16:29:11 字数 238 浏览 1 评论 0原文

为什么我总是在哈希表上看到这些函数的不同运行时复杂性？

在 wiki 上，搜索和删除都是 O(n) （我认为哈希表的要点是不断查找，所以如果搜索是 O(n) 又有什么意义呢）。

在不久前的一些课程笔记中，我看到了一系列取决于某些细节的复杂性，其中包括一个 O(1) 的复杂性。如果我可以获得所有 O(1)，为什么还要使用任何其他实现？

如果我在 C++ 或 Java 等语言中使用标准哈希表，预计时间复杂度是多少？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

陌路终见情 2025-01-10 16:29:11

哈希表是O(1) 平均和摊销情况复杂性，但会遭受O(n) 最坏情况时间复杂。 [我认为这就是您困惑的地方]

哈希表由于两个原因而遭受 O(n) 最坏的时间复杂度：

如果太多元素被散列到同一个键中：查看该键的内部可能会需要 O(n) 时间。
一旦哈希表通过了其负载平衡 - 它必须重新哈希[创建一个新的更大的表，并且将每个元素重新插入到表中]。

然而，据说这是 O(1) 平均且摊销的情况，因为：

许多项目将被散列到同一个键的情况非常罕见[如果你选择了一个好的散列函数，但你没有'没有太大的负载平衡。
重新哈希操作的时间为 O(n)，最多可以在 n/2 次操作之后发生，这些操作均假定为 O(1) ：因此，当您对每个操作的平均时间求和时，您会得到： (n*O(1) + O(n)) / n) = O(1)

请注意，由于重新哈希问题 - a实时应用程序和需要低延迟 - 不应使用哈希表作为其数据结构。

编辑：哈希表的另一个问题：缓存

您可能会在大型哈希表中看到性能损失的另一个问题是由于缓存性能造成的。 哈希表的缓存性能较差，因此对于大型集合 - 访问时间可能会更长，因为您需要将表的相关部分从内存重新加载回缓存。

回复收藏 0 原文

南风几经秋 2025-01-10 16:29:11

理想情况下，哈希表的复杂度是O(1)。问题是如果两个键不相等，但它们会产生相同的哈希值。

例如，假设字符串“it was the best of times it was the bad of times” 和 “Green Eggs and Ham” 都产生了哈希值 123。

当插入第一个字符串时，它被放入存储桶 123 中。当插入第二个字符串时，它会看到存储桶 123 已经存在一个值。然后它将新值与现有值进行比较，并发现它们不相等。在这种情况下，将为该键创建一个数组或链表。此时，检索该值的时间复杂度为 O(n)，因为哈希表需要迭代该存储桶中的每个值以找到所需的值。

因此，在使用哈希表时，使用具有非常好的哈希函数的键非常重要，该函数既快速又不会经常导致不同对象出现重复值。

有道理吗？

回复收藏 0 原文

暖阳 2025-01-10 16:29:11

一些哈希表（cuckoo 哈希）保证了 O(1) 查找

回复收藏 0 原文

一袭白衣梦中忆 2025-01-10 16:29:11

也许您正在考虑空间复杂度？即 O(n)。其他复杂性与哈希表条目中的预期相同。随着桶数量的增加，搜索复杂度接近 O(1)。如果在最坏的情况下哈希表中只有一个桶，那么搜索复杂度为 O(n)。

根据评论进行编辑 我认为 O(1) 是平均情况是不正确的。它确实是（正如维基百科页面所说）O(1+n/k)，其中 K 是哈希表大小。如果 K 足够大，则结果实际上是 O(1)。但是假设K是10，N是100，那么每个桶平均有10个条目，所以搜索时间肯定不是O(1)；它是最多 10 个条目的线性搜索。

回复收藏 0 原文