当前位置：文江博客话题详情

我可以使用 md5 防止重复内容吗？

发布于 2024-07-26 16:50:35 字数 147 浏览 4 评论 0原文

我想防止重复的内容。我不想保留内容的副本，因此我决定仅保留 md5 签名。

我读到 md5 冲突确实发生了，不同的内容可能会给出相同的 md5 签名。

你觉得md5够用吗？

我应该同时使用 md5 和 sh1 吗？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

咋地 2024-08-02 16:50:35

人们已经能够在人为的情况下故意产生 MD5 冲突，但对于防止重复内容（在没有恶意用户的情况下）来说，这已经足够了。

话虽如此，如果您可以使用 SHA-1（或 SHA-2），那么您应该使用 SHA-1（或 SHA-2），这样您就可以稍微但明显地避免碰撞。

回复收藏 0 原文

oО清风挽发oО 2024-08-02 16:50:35

MD5 应该没问题，碰撞很少见，但如果你真的担心，也可以使用 sha-1。

虽然我猜签名确实没有那么大，所以如果您有空闲的处理周期和磁盘空间，您可以同时执行这两项操作。但如果空间或速度有限，我就选择一个。

回复收藏 0 原文

再浓的妆也掩不了殇 2024-08-02 16:50:35

如果存在哈希冲突，为什么不简单地逐字节比较内容呢？哈希冲突非常罕见，因此您只需很少进行逐字节检查即可。这样，只有当项目确实重复时才会检测到重复项

回复收藏 0 原文

万水千山粽是情ミ 2024-08-02 16:50:35

md5应该足够了。是的，可能会发生冲突，但发生这种情况的可能性非常小，除非您确实在跟踪数十亿条内容，否则我不会担心它。

回复收藏 0 原文

谈下烟灰 2024-08-02 16:50:35

如果您真的害怕意外冲突，只需同时进行 MD5 和 SHA1 哈希并进行比较即可。如果两者匹配，则内容相同。如果其中任何一个不同，则内容不同。

回复收藏 0 原文

何其悲哀 2024-08-02 16:50:35

组合算法仅用于混淆，但不会提高哈希算法的安全性。

恕我直言，MD5 太糟糕了，无法使用。研究人员证明了伪造 MD5 哈希值，他们证明能够伪造生成 MD5 冲突的内容，从而为生成伪造的 CSR 以便从 RapidSSL 为他们不拥有的域名购买证书打开了大门。现在就安全！第 179 集解释了整个过程。

对我来说，基于 SHA 的哈希值更强大，并且大多数开发平台都支持它，因此选择很容易。剩下的决定因素是块大小。

回复收藏 0 原文

明天过后 2024-08-02 16:50:35

时间戳+md5一起就足够安全了。

回复收藏 0 原文

瑶笙 2024-08-02 16:50:35

MD5已被破坏，SHA1已接近它。使用 SHA2。

编辑

根据OP的更新，故意碰撞似乎并不是这里的一个严重问题。对于无意的情况，任何至少具有 64 位输出的体面哈希都可以。

一般来说，我仍然会避免使用 MD5 甚至 SHA1，但没有理由对此武断。如果该工具适合这里，那么一定要使用它。

回复收藏 0 原文

~没有更多了~

关于作者

娇柔作态

暂无简介

0 文章

0 评论

25 人气

关注发私信

杨绘峰

文章 0 评论 0

关注

听闻余生

文章 0 评论 0

关注

谜兔

文章 0 评论 0

关注

xiaotwins

文章 0 评论 0

关注

你说

文章 0 评论 0

关注

若能看破又如何

文章 0 评论 0

友情链接

文江博客

我可以使用 md5 防止重复内容吗？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（8）

关于作者

相关话题

热门标签

推荐作者

杨绘峰

听闻余生

谜兔

xiaotwins

你说

若能看破又如何

友情链接

我可以使用 md5 防止重复内容吗？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（8）

关于作者

相关话题

热门标签

推荐作者

杨绘峰

听闻余生

谜兔

xiaotwins

你说

若能看破又如何

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。