当前位置：文江博客话题详情

哈希码与 SHA-1

发布于 2024-07-20 12:45:23 字数 325 浏览 4 评论 0原文

我想比较一些代表树的大型对象并缓存某些东西以避免每次将新对象与已经存在的对象进行比较...

问题是什么是最好的东西？（性能和碰撞之间的折衷......）。

一方面，我有一个基于各个字段的值的常规 hashCode 函数（遵循

另一方面，我有来自标准java发行版的带有SHA-1算法的MessageDigest方法。我认为它是效率不会很高，但我的冲突可能会减少。在我的上下文中这是正确的解决方案还是完全错误？

问题是我不知道对象的大小是多少。请注意，计算出的值不会在哈希表中使用，

谢谢...

收藏 0

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

评论（5）

白云不回头 2024-07-27 12:45:23

请参阅以下内容：

请记住以下几点：

一个对象可能是不相等，但具有相同的哈希码
您的碰撞可能性取决于您遇到的对象数量。
哈希码的有用程度取决于您如何实现检查。

通常，您可以根据预期对象的数量和可能的哈希数（最大哈希值）来确定冲突的可能性。请参阅 http://en.wikipedia.org/wiki/Birthday_paradox 了解详细说明。

亲自？ Java对象（实例化类）< 一万？哈希码。代表文件/blob/大量数据？ SHA-1。我在数据库中使用 SHA-1 哈希来防止人们多次对同一文件进行 ETL 工作。然后，我在第二级再次使用 SHA-1 散列，以防止人们在多个文件中对同一部分进行 ETL（例如，不同的文件但相同的顺序出现两次）。

回复收藏 0 原文

临风闻羌笛 2024-07-27 12:45:23

就我个人而言，我会为对象使用 hashCode() ，直到证明任何可能的冲突都是实际问题，以避免抢先优化您实际上可能没有的问题。

回复收藏 0 原文

千秋岁 2024-07-27 12:45:23

由于生日问题，发生冲突的可能性取决于您正在处理的项目数量。

SHA-1 的 160 位空间是如此之大，以至于我怀疑您是否有足够的项目来看到碰撞。

在拥有超过 50,000 个项目之前，hashCode() 的 32 位空间不应出现大量冲突。然而，这取决于使用良好的哈希算法。

为了应用像 SHA-1 这样的加密摘要，您需要将图形转换为字节字符串，这可能需要大量计算，而且可能很复杂。

回复收藏 0 原文

如此安好 2024-07-27 12:45:23

通常对于重复文件/数据检测，MD5 是速度和冲突机会之间的良好权衡。如果有人故意制作文件来欺骗您的程序（它很容易受到碰撞攻击），那么 MD5 是不合适的。但如果您只是担心偶然的冲突，那么目前它的 128 位宽度实际上总是足够的。

SHA-1 和 SHA-256 为您提供了一些针对蓄意冲突攻击的保护（SHA-1 的理论攻击，但尚无已知的实际攻击；对于密钥数据，很少值得超过 160 位哈希码宽度）。 SHA-1 的速度大约是 MD5 的一半。

当然，如果您使用 MD5，性能可能不会成为太大的问题。但显然这确实取决于数据的大小。您可能对我整理的有关安全哈希函数的性能的一些信息感兴趣爪哇。

如果您确实需要更快的速度并且只处理几百万项数据，那么可以考虑的另一个选择是 Numerical Recipes 作者提出的 64 位哈希算法。

Java 的标准 hashCode() 实现（比如 String）可能不合适：除了有关哈希质量的任何问题之外，它的 32 位宽度意味着您预计在 16,000 个项目左右后就会发生冲突。

回复收藏 0 原文

总攻大人 2024-07-27 12:45:23

我赞同 matt b 的说法“在需要优化之前不要优化”。

但是，如果您决定以后需要的不仅仅是哈希码……我使用消息摘要（在我的例子中为 MD5）来“唯一”识别从 RSS 提要下载的各种项目，因此我最终没有得到相同的结果当我一遍又一遍地轮询时，该项目在列表中多次出现。这些通常都是小帖子，因此可以快速计算摘要。根据我的经验，它非常有效并且效果很好。

由于它们通常是一种单向函数，即使输入数据中非常小的变化也会产生强烈的反应，因此您绝对不太可能与 MD5 或 SHA-1 发生冲突。

回复收藏 0 原文

~没有更多了~

关于作者

暂无简介

0 文章

0 评论

21 人气

关注发私信

相关话题

热门标签

操作系统程序设计 IT运维 Linux系统管理 JavaScript 服务器应用 solaris C/C++ PHP Shell BSD Vue.js aix Oracle Python HTML 系统管理 HTML5 CSS 前端

推荐作者

qq_FjTq5B

文章 0 评论 0

18273202778

文章 0 评论 0

WordPress小学生

文章 0 评论 0

〃温暖了心ぐ

文章 0 评论 0

迷乱花海

文章 0 评论 0

niuniu

文章 0 评论 0

友情链接

我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的隐私政策了解更多相关信息。单击 接受 或继续使用网站，即表示您同意使用 Cookies 和您的相关数据。

原文