我如何安全地假设 SHA1 哈希的一部分的唯一性？

发布于 2024-10-25 01:30:54 字数 154 浏览 4 评论 0原文

我目前正在使用 SHA1 来稍微缩短 url：

Digest::SHA1.hexdigest("salt-" + url)

仅使用 SHA1 的前 8 个字符作为唯一标识符（就像 GitHub 显然对提交所做的那样）有多安全？

原文

I'm currently using a SHA1 to somewhat shorten an url:

Digest::SHA1.hexdigest("salt-" + url)

How safe is it to use only the first 8 characters of the SHA1 as a unique identifier, like GitHub does for commits apparently?

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

抽个烟儿 2024-11-01 01:30:54

要计算给定长度和哈希数发生冲突的概率，请参阅生日问题。我不知道您将拥有多少哈希值，但这里有一些示例。 8 个十六进制字符是 32 位，因此对于大约 100 个哈希值，冲突的概率约为 1/1,000,000，对于 10,000 个哈希值，碰撞概率约为 1/100，对于 100,000 个哈希值，碰撞概率约为 3/4 等。

请参阅维基百科上的生日攻击文章可找到满足您需求的良好哈希长度。例如，如果您希望对于超过 100,000 个哈希值的集合，冲突的可能性小于 1/1,000,000,000，则使用 64 位或 16 个十六进制数字。

这完全取决于您将拥有多少个哈希值以及您愿意接受的冲突概率是多少（因为总是存在一定的概率，即使概率非常小）。

回复收藏 0 原文

a√萤火虫的光℡ 2024-11-01 01:30:54

如果您谈论的是十六进制的 SHA-1，那么每个字符只能获得 4 位，总共 32 位。碰撞的几率与该最大值的平方根成反比，因此约为 1/65536。如果您的网址缩短器经常被使用，那么您可能很快就会开始看到冲突。

至于替代方案，最明显的可能就是只维护一个计数器。由于您需要存储一个 URL 表来将缩短的 URL 转换回原始 URL，因此您基本上只需将每个新 URL 存储在表中即可。如果它已经存在，则提供其现有编号。否则，您将其插入并为其指定一个新编号。无论哪种方式，您都将该号码提供给用户。

回复收藏 0 原文

稀香 2024-11-01 01:30:54

这取决于您想要实现的目标。 SHA1 的输出相对于输入来说实际上是随机的（一个好的哈希函数的输出会根据输入中的一位变化而改变一半的位，而 SHA1 虽然不完美，但相当不错），并且通过获取 160 位输出的 32 位（假设 8 个十六进制数字）子集，可以将输出空间从 2^160 值减少到 2^32 个值。在所有条件相同的情况下（事实并非如此），这将大大降低发现碰撞的难度。

但是，如果哈希函数的输入必须是有效的 URL，则会显着减少可能的输入数量。 @rsp 指出了生日问题，但考虑到这一点，我不确定它到底有多适用，至少在其简单的形式中是如此。此外，它很大程度上假设没有其他预防措施。

我更感兴趣的是你为什么要这样做。这是关于用户需要记住和输入的 URL 吗？如果是这样，添加一堆随机的十六进制数字可能是一个坏主意。它是一个 URL 还是仅以编程方式传递的 URL 参数？那么，我就不会太在意长度了。不管怎样，可能有更好的方法来完成您想要完成的任务。

回复收藏 0 原文