当前位置：文江博客话题详情

Hash RUNtime algorithm hashtable hashmap

将 n 个元素插入到空哈希表中的运行时间

发布于 2024-07-19 03:51:41 字数 425 浏览 4 评论 0原文

人们说放入哈希表需要摊销 O(1)。因此，放入n个元素一定是O(n)。然而，对于大 n 来说情况并非如此，因为正如回答者所说，“满足预期摊销 O(1) 所需的只是扩展表并在发生冲突时使用新的随机哈希函数重新哈希所有内容。”

那么：向哈希表插入 n 个元素的平均运行时间是多少？我意识到这可能取决于实现，因此请提及您正在谈论的实现类型。

例如，如果存在 (log n) 个等间隔的碰撞，并且每次碰撞需要 O(k) 才能解决，其中 k 是哈希表的当前大小，那么您将具有以下递归关系：（

T(n) = T(n/2) + n/2 + n/2

即，您采用插入 n/2 个元素的时间，然后发生碰撞，需要 n/2 来解决，然后执行剩余的 n/2 插入而不发生碰撞）。这最终仍然是 O(n)，所以是的。但这合理吗？

People say it takes amortized O(1) to put into a hash table. Therefore, putting n elements must be O(n). That's not true for large n, however, since as an answerer said, "All you need to satisfy expected amortized O(1) is to expand the table and rehash everything with a new random hash function any time there is a collision."

So: what is the average running-time of inserting n elements into a hash table? I realize this is probably implementation-dependent, so mention what type of implementation you're talking about.

For example, if there are (log n) equally spaced collisions, and each collision takes O(k) to resolve, where k is the current size of the hashtable, then you'd have this recurrence relation:

T(n) = T(n/2) + n/2 + n/2

(that is, you take the time to insert n/2 elements, then you have a collision, taking n/2 to resolve, then you do the remaining n/2 inserts without a collision). This still ends up being O(n), so yay. But is this reasonable?

收藏 0

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

评论（4）

一江春梦 2024-07-26 03:51:41

这完全取决于你的重新哈希效率有多低。具体来说，如果您可以第二次正确估计哈希表的预期大小，那么您的运行时间仍然接近 O(n)。实际上，您必须先指定重新哈希大小计算的效率有多低，然后才能确定预期的顺序。

回复收藏 0 原文

鹿童谣 2024-07-26 03:51:41

人们说放入哈希表需要摊销 O(1)。

从理论角度来看，预期摊销为 O(1)。

哈希表本质上是一种随机数据结构，就像快速排序是一种随机算法一样。您需要生成具有一定随机性的哈希函数，否则会存在非 O(1) 的病态输入。

您可以使用动态完美哈希实现预期摊销 O(1)：

我最初发布的天真的想法是在每次碰撞时使用新的随机散列函数重新散列。（另请参阅完美哈希函数）问题是这需要 O(n^2 ) 空间，来自生日悖论。

解决方案是有两个哈希表，第二个表用于冲突；通过重建第二个表来解决该表上的冲突。该表将有 O(\sqrt{n}) 个元素，因此将增长到 O(n) 大小。

在实践中，您通常只使用固定的哈希函数，因为您可以假设（或不关心）您的输入是病态的，就像您经常在不预先随机化输入的情况下进行快速排序一样。

回复收藏 0 原文

清醇 2024-07-26 03:51:41

O(1) 的意思是，该操作是在恒定时间内执行的，并且它不依赖于数据结构中的元素数量。

简而言之，这意味着无论您的数据结构有多大，您都必须支付相同的成本。

实际上，这意味着当您不必存储大量数据时，简单的数据结构（例如树）通常更有效。根据我的经验，我发现树的速度最多可达 1k 个元素（32 位整数），然后是哈希表。但像往常一样YMMW。

回复收藏 0 原文

幸福丶如此 2024-07-26 03:51:41

为什么不在您的系统上运行一些测试呢？也许如果您发布源代码，我们可以回去并在我们的系统上测试它们，我们真的可以将其形成一个非常有用的讨论。

决定算法实际花费多少时间的不是实现，而是环境。但是，您可以查看是否有可用的基准测试示例。我发布结果的问题是没有用的，因为人们不知道我的系统上还运行着什么，现在有多少 RAM 是可用的等等。你只能有一个广泛的想法。这和大 O 给你的效果差不多。

回复收藏 0 原文

~没有更多了~

关于作者

因为看清所以看轻

暂无简介

0 文章

0 评论

670 人气

关注发私信

相关话题

热门标签

操作系统程序设计 IT运维 Linux系统管理 JavaScript 服务器应用 solaris C/C++ PHP Shell BSD Vue.js aix Oracle Python HTML 系统管理 HTML5 CSS 前端

推荐作者

謌踐踏愛綪

文章 0 评论 0

开始看清了

文章 0 评论 0

高速公鹿

文章 0 评论 0

alipaysp_PLnULTzf66

文章 0 评论 0

热情消退

文章 0 评论 0

白色月光

文章 0 评论 0

友情链接

我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的隐私政策了解更多相关信息。单击 接受 或继续使用网站，即表示您同意使用 Cookies 和您的相关数据。

原文