当前位置：文江博客话题详情

是否存在可以保证哈希算法唯一的情况？

发布于 2024-08-21 20:47:05 字数 90 浏览 15 评论 0原文

如果我使用字节大小大于数据（例如 sha-256）的哈希算法对大小受限的类似数据（例如社会安全号码）进行哈希处理，哈希是否能保证与数据具有相同级别的唯一性？原始数据？

需要登录才能够评论，你可以免费注册一个本站的账号。

哈希冲突的概率与输入字符串的大小无关（除非它指示需要多少个输入来保持唯一性）。当您使用完美哈希算法对 0 和 1 进行哈希处理时，可能会发生哈希冲突，尽管可能性为 1/(2^位长度)。在 SHA-256 的情况下，其实际上为零。

哈希冲突是一个生日悖论问题。在 256 位哈希的情况下，两个输入之间发生冲突的概率完全取决于输入的数量，为：

1 - (2^256)！ / ((2^256^inputcount) * (2^256-inputcount)!) 或者正如其他人所说 - 对于合理数量的输入来说基本上为零。

﹂绝世的画 2024-08-28 20:47:05

您始终可以创建保证唯一性的自定义哈希。对于已知域（如 SSN）中的数据，练习相对简单。

如果您的目标哈希值实际上具有比您正在哈希的位数更多的可用位，则哈希只是将输入值映射到可用输出值之一。这将是从作为多字节整数的输入值到作为多字节整数的输出的简单线性映射。

当您的目标哈希值的位数少于正在哈希的位数时，就无法保证唯一性。

倾其所爱 2024-08-28 20:47:05

其他人则指出，碰撞不应成为问题；这就是加密安全哈希函数的全部要点。我想添加以下内容：

如果您的输入集足够小（例如数据是 SSN - 数量不到十亿），那么不存在冲突是可以验证的：只需彻底测试即可。
如果输入集太大而无法彻底扫描，则预计无法证明不存在碰撞。好的哈希函数应该充当随机预言机，并且在随机预言机上，如果不进行详尽的尝试，就无法证明这样的属性。能够证明不存在碰撞可能看起来像是该函数的一个弱点。