当前位置：文江博客话题详情

针对查找进行优化的哈希图

发布于 2024-12-20 07:32:01 字数 177 浏览 1 评论 0原文

我正在寻找一些具有固定键（在初始化期间固定）并且查找速度更快的地图。它可能不支持稍后添加/更新元素。是否有某种算法可以查找键列表并制定一个函数，以便以后查找速度更快。就我而言，键是字符串。

更新：

密钥在编译时未知。但在应用程序的初始化期间。稍后不会有任何进一步的插入，但会有大量的查找。所以我希望优化查找。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

紫竹語嫣☆ 2024-12-27 07:32:01

CMPH 可能就是您要找的。基本上，这是 gperf 不需要在编译时进行设置。

当然，C++11 的 std::unordered_map 也可能会这样做，尽管可能会出现一些冲突。

由于您查找字符串，因此对于字符串，特里树（任何不同的特里树风格、暴击位或它们具有的任何时髦名称）也可能值得研究，特别是如果您有很多它们。有很多免费的 trie 实现可以免费使用。
Try 的优点是它们可以对字符串进行索引压缩，因此使用更少的内存，从而更有可能在缓存中保存数据。此外，访问模式的随机性较低，这也是缓存友好的。哈希表必须存储值加上哈希值，并或多或少随机地（不是随机，而是不可预测地）索引到内存中。理想情况下，特里结构/类似特里结构的结构只需要一位额外的位来区分每个节点中的键与其公共前缀。

（顺便注意，在这种情况下，O(log(N)) 很可能比 O(1) 更快，因为 big-O 不考虑类似的事情。）

回复收藏 0 原文

悲凉≈ 2024-12-27 07:32:01

请注意，这些是不同的事情：您是否需要上限，您是否需要快速的典型速率，或者您是否需要有史以来最快的查找，不问任何问题？最后一个会让你付出代价，前两个可能是相互冲突的目标。

您可以尝试根据输入创建一个完美的哈希函数（即不存在输入集冲突的函数）。这是一个以某种方式解决的问题（例如 this，此）。然而，它们通常生成源代码，并且可能花费大量时间生成哈希函数。

对此的修改将使用通用散列函数（例如移位乘加）并对合适的参数进行强力搜索。

这必须与一些字符串比较的成本进行权衡（如果您不需要整理的话，这并不是那么昂贵）。

另一种选择是使用两个不同的哈希函数 - 这会增加单次查找的成本，但与外星人窃取时钟周期相比，降级的可能性稍小一些。对于典型的字符串和像样的哈希函数来说，这不太可能是一个问题。

回复收藏 0 原文

枫以 2024-12-27 07:32:01

尝试 google-sparsehash：http://code.google.com/p/google-sparsehash/< /a>

An extremely memory-efficient hash_map implementation. 2 bits/entry overhead! 
The SparseHash library contains several hash-map implementations, including 
implementations that optimize for space or speed.

Try google-sparsehash: http://code.google.com/p/google-sparsehash/

An extremely memory-efficient hash_map implementation. 2 bits/entry overhead! 
The SparseHash library contains several hash-map implementations, including 
implementations that optimize for space or speed.

回复收藏 0 原文