当前位置：文江博客话题详情

Hash simd hash-collision

如果我对一堆哈希值进行哈希处理，哈希冲突的可能性有多大？

发布于 2024-08-10 03:50:23 字数 212 浏览 12 评论 0 原文

假设我使用哈希来识别文件，所以我不需要它是安全的，我只需要最大限度地减少冲突。我当时想，我可以通过使用 SIMD 并行运行四个散列，然后对最终结果进行散列来加速散列。如果哈希被设计为采用 512 位块，我只需单步执行一次采用 4x512 位块的文件，并从中生成四个哈希；然后在文件的末尾，我将四个结果哈希值哈希在一起。

我很确定这种方法会产生更差的哈希值......但是差多少？有粗略的计算吗？

收藏 0

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

评论（1）

聚集的泪 2024-08-17 03:50:23

从磁盘读取文件块的速度比散列它们的速度更快的想法是一个未经测试的假设吗？磁盘 IO（甚至 SSD）比哈希处理的 RAM 慢很多数量级。

确保低冲突是所有哈希的设计标准，所有主流哈希都做得很好 - 只需使用主流哈希，例如 MD5。

具体到发帖人正在考虑的解决方案，并行散列不会削弱散列。正如海报所说，有专门为块的并行散列和组合结果而设计的散列，尽管可能尚未广泛采用（例如 MD6，从 SHA3 中完整退出）

更一般地说，有主流实现使用 SIMD 的哈希函数。哈希实现者非常性能意识，并且确实需要时间来优化其实现;你的工作会很辛苦，与他们的努力相当。进行强哈希处理的最佳软件大约是 6 到 10 个周期/字节。如果散列是真正的瓶颈，则还可以使用硬件加速散列。

回复收藏 0 原文

~没有更多了~

关于作者

如果没有你

暂无简介

文章

评论

27 人气

关注发私信

相关话题

更多

推荐作者

关注

Promise

文章 0 评论 0

关注

qq_lbRlsh

文章 0 评论 0

关注

待＂谢繁草

文章 0 评论 0

关注

yy2010hell

文章 0 评论 0

关注

漫无边际

文章 0 评论 0

关注

傲娇萝莉攻

文章 0 评论 0

更多

友情链接

文江博客

我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的隐私政策了解更多相关信息。单击 接受 或继续使用网站，即表示您同意使用 Cookies 和您的相关数据。

原文