当前位置：文江博客话题详情

选择哈希密钥类型的基本原理

发布于 2024-08-29 08:47:14 字数 436 浏览 5 评论 0原文

伙计们，我有一个数据结构，它有 25 个不同的键（整数）和一个值。我有这些对象的列表（比如 50000），我打算使用哈希表来存储/检索它们。我计划采取其中一种方法。

根据这 25 个整数键创建一个整数哈希并将其存储在哈希表中。（是的！我有一些方法来处理冲突）
在各个键上进行字符串连接，并将其用作哈希表的哈希键。例如，如果键值为 1,2,4,6,7，则哈希键将为“12467”。

假设我总共有 50000 条记录，每条记录都有 25 个不同的键和一个值，那么当涉及到检索和插入记录所需的字符串比较成本时，我的第二种方法会不会太过分了？

更多信息！

哈希表中的每个桶都是一棵平衡二叉树。
我正在使用 boost 库的 hash_combine 方法从 25 个键创建哈希。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

画骨成沙 2024-09-05 08:47:14

绝对使用第一种方法，因为如果使用第二种方法，则需要一个具有 1x10^(25m) 的哈希表，其中 x 是可用键槽的最大长度。

例如，如果键的最大数量是 9999，则 m 将为 4，并且表中需要 1x10^100 个槽。

解释：

哈希表背后的想法是，您可以以 O(1) 的效率（不考虑碰撞）随机访问任何元素，因为任何元素的哈希实际上就是它在哈希表中的位置。例如，如果我对对象 X 进行哈希处理并返回 24 的哈希值（或者转换为数字的某个字符串哈希值，结果是 24），我只需转到表的槽 24（通常实现为数组），并且可以检索对象 X。

但是，如果您使用第二种方法（连接 25 个数字 - 我们在这里用数字来简化事情 - 一起形成哈希），则最大的哈希将是 9999999999999999999999999。因此要检索该方法如果要从哈希表中获取对象，您必须从位置 9999999999999999999999999 检索它 - 这意味着您的表必须至少有那么多点。

请记住，对于第一个 - 由于您使用的是二叉树，因此冲突并不是什么大问题。最坏的情况是检索/插入效率为 O(log(n))，无论如何，这并不是那么糟糕。