哈希函数组合——碰撞风险是否显着降低？

发布于 2024-08-02 22:52:37 字数 379 浏览 18 评论 0原文

有谁知道通过组合哈希函数来降低冲突概率是否有真正的好处？我特别需要了解 32 位哈希，即结合 Adler32 和 CRC32。 基本上，adler32(crc32(data)) 产生的碰撞概率会比 crc32(data) 更小吗？ 最后一条评论此处给出了一些支持合并的测试结果，但没有提及来源。就我的目的而言，碰撞并不重要（即任务不涉及安全），但如果可能的话，我宁愿尽量减少概率。 PS：我刚刚开始进入奇妙的哈希世界，并阅读了大量相关内容。抱歉，如果我问了一个愚蠢的问题，我什至还没有获得正确的“哈希方言”，可能我对此的谷歌搜索也很糟糕。谢谢。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

我爱人 2024-08-09 22:52:37

像这样将它们串联起来是没有意义的。您正在将一个 32 位空间散列到另一个 32 位空间。

在第一步发生crc32碰撞的情况下，最终的结果仍然是碰撞。然后在 adler32 步骤中添加任何潜在的冲突。所以它不可能变得更好，只能是一样或更糟。

为了减少冲突，您可以尝试独立使用两个哈希值来创建 64 位输出空间：

adler32(data) << 32 | 32 crc32(data)

这样做是否有显着的好处，我不确定。

请注意，您提到的原始评论是独立存储哈希值：

无论你使用哪种算法
会有一些错误的机会
积极的一面。但是，您可以减少
这些机会有相当大的差距
通过使用两种不同的散列
算法。如果你要计算
并存储 CRC32 和
Alder32 对于每个 url，a 的几率
两个哈希同时发生冲突
对于任何给定的 url 对来说
减少。
当然，这意味着存储两倍
许多信息是其中的一部分
你原来的问题。然而，有
是存储两组哈希值的一种方式
数据，使其需要最少的
内存（10kb左右）同时给予
几乎相同的查找性能（15
微秒/查找与 5 相比
微秒）作为 Perl 的哈希值。