当前位置：文江博客话题详情

如何检查我的自定义哈希在 hash_map 中是否良好？

发布于 2024-08-23 12:49:50 字数 231 浏览 3 评论 0原文

我已经在 stdext::hash_map 中为我的自定义键编写了自定义哈希，并想检查哈希器是否良好。我使用的是 VS 2008 提供的 STL。据我所知，典型的检查是检查存储桶之间分布的均匀性。

我应该如何正确组织这样的检查？我想到的一个解决方案是修改 STL 源代码，向 hash_map 添加一个方法，该方法可以遍历存储桶并完成主题。有没有更好的方法？

也许，从 hash_map 派生并在那里创建这样的方法？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

少跟Wǒ拽 2024-08-30 12:49:50

最好的选择可能是将哈希算法应用于整数数组，并根据实际数据计算每个哈希桶被命中的次数。（我真的建议将 STL 从方程中剔除。）

如果您最终发现大量现实世界数据的计数偏差很大，那么当存在大量空值时，您的散列算法就会产生大量冲突。（或更空的）桶可用。

请注意，“高偏差”是一个相对术语。一个好的哈希算法是一个确定性的随机过程，任何随机过程都有可能产生奇怪的结果，因此经常测试，好好测试，并尽可能使用实际问题域作为测试和控制的来源。

回复收藏 0 原文

盛夏已如深秋| 2024-08-30 12:49:50

我将通过 stl::hash_map 运行一个（大型）数据集。收集所有存储桶的结果

完成后，我将使用以下方法从 hash_map

size_type elems_in_bucket (size_type __n) const;

：最后，我将计算 的标准偏差 (SD) elem-to-bucket 分布。

我会针对不同的哈希函数执行上述操作。无论哪个哈希函数产生最小 SD 都是获胜者（对于此数据集）。

I'd run one (large) dataset through stl::hash_map. Once done, I'd collect the results for all buckets using the following method

From hash_map:

size_type elems_in_bucket (size_type __n) const;

Finally, I would do compute the standard deviation (SD) of the elem-to-bucket distribution.

I'd do the above for different hash functions. Whichever hash function results in minimum SD is the winner (for this dataset).

回复收藏 0 原文

~没有更多了~

关于作者

又爬满兰若

暂无简介

0 文章

0 评论

21 人气

关注发私信

alipaysp_b7SHQYtKbj

文章 0 评论 0

关注

疯到世界奔溃

文章 0 评论 0

关注

笨死的猪

文章 0 评论 0

关注

西瑶

文章 0 评论 0

关注

灵芸

文章 0 评论 0

关注

故事与诗

文章 0 评论 0

友情链接

文江博客

如何检查我的自定义哈希在 hash_map 中是否良好？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

alipaysp_b7SHQYtKbj

疯到世界奔溃

笨死的猪

西瑶

灵芸

故事与诗

友情链接

如何检查我的自定义哈希在 hash_map 中是否良好？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

alipaysp_b7SHQYtKbj

疯到世界奔溃

笨死的猪

西瑶

灵芸

故事与诗

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。