c++哈希表，其中键是字符串，值是字符串向量

发布于 2024-11-16 03:49:35 字数 266 浏览 7 评论 0原文

我收集了大量独特的字符串（大约 500k）。每个字符串都与一个字符串向量相关联。我目前正在将这些数据存储在 a 中

map<string, vector<string> >

，并且工作正常。不过，我希望查找地图的速度比 log(n) 更快。在这些受限的情况下，如何创建支持 O(1) 查找的哈希表？看来这应该是可能的，因为我提前知道所有的密钥......并且所有的密钥都是唯一的（所以我不必考虑冲突）。

干杯!

原文

I have a large collection of unique strings (about 500k). Each string is associated with a vector of strings. I'm currently storing this data in a

map<string, vector<string> >

and it's working fine. However I'd like the look-up into the map to be faster than log(n). Under these constrained circumstances how can I create a hashtable that supports O(1) look-up? Seems like this should be possible since I know all the keys ahead of time... and all the keys are unique (so I don't have to account for collisions).

Cheers!

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

酒与心事 2024-11-23 03:49:35

您可以使用 boost::unordered_map、std::tr1::unordered_map 或（在 C++0x 编译器上）std::unordered_map 创建哈希表代码>.这几乎需要零努力。 Google Sparsehash 可能速度更快，而且占用的内存也更少。（删除可能很痛苦，但似乎您不需要这样做。）

如果代码仍然不够快，您可以按照其他人的建议，利用最小完美哈希值来利用密钥的先验知识，以获得有保证的 O (1)性能。代码生成工作是否值得取决于您；将 500k 个密钥放入像 gperf 这样的工具中可能需要代码生成器。

您可能还想看看 CMPH，它通过 C 语言在运行时生成完美的哈希函数API。