当前位置：文江博客话题详情

哈希表查找 - 具有完美哈希，C 语言

发布于 2024-12-03 10:14:09 字数 365 浏览 0 评论 0原文

我有一个 C 语言应用程序，需要在其中进行表查找。

这些条目是字符串，所有内容在运行时开始时都是已知的。该表初始化一次，然后查找多次。该表可以更改，但基本上就像应用程序重新开始一样。我认为这意味着我可以使用完美哈希？哈希表初始化花费一些时间是可以的，因为它只发生一次。

会有 3 到 100,000 个条目，每个条目都是唯一的，我估计 80% 的情况下条目少于 100 个。在这些情况下，简单的简单查找“足够快”。（==没有人抱怨）

但是，在有 10k+ 条目的情况下，简单方法的查找速度是不可接受的。什么是为 C 中的字符串提供良好的基于哈希表的查找性能的好方法？假设我没有像 Boost/etc 这样的第三方商业库。我应该使用什么哈希算法？我该如何决定？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

〃温暖了心ぐ 2024-12-10 10:14:09

生成完美的哈希值并不是一个简单的问题。有一些图书馆专门致力于这项任务。
在这种情况下，最受欢迎的可能是 CMPH。我还没有使用过它，所以无法提供更多帮助。 gperf 是另一个工具，但它要求在编译时知道字符串（您可以工作通过编译 .so 并加载来解决它，但有点矫枉过正）。

但坦率地说，我至少会尝试先进行二分搜索。只需使用 qsort 对数组进行排序，然后使用 bsearch 进行搜索（或自行创建）。自 C89 以来，这两个都是 stdlib.h 的一部分。

回复收藏 0 原文

我们只是彼此的过ke 2024-12-10 10:14:09

如果简单的（我假设你的意思是线性）方法对于 100 个条目是可以的（因此平均进行 50 次比较），那么二分搜索对于 100,000 个条目就足够了（最多需要 17 次比较）。

所以我根本不会打扰哈希，而只是在启动时对字符串表进行排序（例如使用 qsort），然后使用二分搜索（例如使用 bsearch< /code>）来查找条目。

回复收藏 0 原文

浅暮の光 2024-12-10 10:14:09

如果（最大）表大小已知，则带有链接的普通哈希表很容易实现。每个项目的大小开销仅为两个整数。使用合理的散列函数，每次查找平均只需要 1.5 次探测，这对于 100% 加载的表而言。

仅当您的数据不发生变化时，构建完美的哈希才是可行的。一旦发生变化，您就必须重新计算和重新散列，这比进行一些额外的比较要昂贵得多。

回复收藏 0 原文

~没有更多了~

关于作者

冷清清

暂无简介

0 文章

0 评论

290 人气

关注发私信

友情链接

文江博客

哈希表查找 - 具有完美哈希，C 语言

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（3）

关于作者

相关话题

热门标签

推荐作者

Gabu-gabumon

qq_CgiN62

荔枝明

赏烟花じ飞满天

独守阴晴ぅ圆缺

¤→小豸慧

友情链接

哈希表查找 - 具有完美哈希，C 语言

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（3）

关于作者

相关话题

热门标签

推荐作者

Gabu-gabumon

qq_CgiN62

荔枝明

赏烟花じ飞满天

独守阴晴ぅ圆缺

¤→小豸慧

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。