当前位置：文江博客话题详情

非STL哈希表类型结构

发布于 2024-11-06 02:06:17 字数 183 浏览 1 评论 0原文

有没有一种方法可以编写简单的哈希表，其中键为“字符串”，值作为频率，这样就不会发生冲突？不会从哈希表中删除，如果该对象已经存在于哈希表中，则只需更新其频率（将它们加在一起）。

我在想可能有一种算法可以从字符串中计算出一个唯一的数字，并将其用作索引。

是的，我避免使用所有 STL 构造，包括 unordered_map。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

情话已封尘 2024-11-13 02:06:17

您可以使用任何完美的哈希生成器，例如 gperf

请参阅此处查看列表： http://en.wikipedia.org/ wiki/Perfect_hash_function

PS。您仍然可能想要使用映射而不是平面数组/向量，以防映射域变得太大/稀疏

回复收藏 0 原文

我ぃ本無心為│何有愛 2024-11-13 02:06:17

这实际上取决于您所说的“简单”是什么意思。

std::map 是一个相当简单的类。尽管如此，它仍然使用红黑树，所有插入、删除和平衡都很好地隐藏起来，并且它被模板化以处理任何可排序类型作为键和任何类型作为值。大多数映射类使用类似的实现，并避免任何类型的散列功能。

没有碰撞的哈希值无论如何都不是一件小事。也许最简单的方法是Pearson Hashing。

看起来你有 3 个选择：

实现你自己的完美哈希类。这将是一个规模相当大的类，具有很多功能和一些相当复杂的算法。我认为这并不简单。
下载并使用现有的完美哈希库。当然，您必须担心可部署性。
使用STL的地图类。它是嵌入式的、文档齐全、易于使用、类型灵活且完全跨平台。这似乎是“最简单”的解决方案。

如果我可以问，你为什么要避免 STL？

回复收藏 0 原文

嘿嘿嘿 2024-11-13 02:06:17

如果预先知道可能的字符串集，则可以使用完美的哈希函数生成器来执行此操作。但否则的话，你所要求的就是不可能的。

现在，通过使用良好的哈希函数并确保表很大，可以使冲突的可能性极低。您基本上需要一个足够大的表来使调用生日悖论的可能性足够低适合你。然后，您只需使用 SHA-1 的 n 位输出，2^n 将是您的表大小。

我还想知道您是否可以使用 Bloom 过滤器并拥有一个实际的计数器而不是位。保留您填充到布隆过滤器中的所有单词的列表以及它们增加的条目（每次都相同），您自己就有一个巨大的线性函数，您可以解决它以获得所有个人再次倒数。

回复收藏 0 原文

~没有更多了~

关于作者

夜空下最亮的亮点

暂无简介

0 文章

0 评论

22 人气

关注发私信

友情链接

文江博客

非STL哈希表类型结构

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（3）

关于作者

相关话题

热门标签

推荐作者

烙印

singlesman

给自己一个微笑

独孤求败

晨钟暮鼓

我是自愿种绣球花的

友情链接

非STL哈希表类型结构

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（3）

关于作者

相关话题

热门标签

推荐作者

烙印

singlesman

给自己一个微笑

独孤求败

晨钟暮鼓

我是自愿种绣球花的

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。