哈希碎片和冲突（续）

发布于 2024-08-31 18:32:31 字数 438 浏览 6 评论 0原文

对于我的这个应用程序，我觉得我可以使用 40 位哈希密钥，这看起来非常低，但看看你是否可以证实我的推理（我想要一个小密钥，因为我想要一个小文件名，并且密钥将被转换为文件名）：（

注意：只有意外碰撞才值得关注 - 没有安全问题。）

这里的关键点是，所讨论的群体被分为几组，并且只有当碰撞发生在同一组内时才相关。 “组”是用户系统上的一个目录（文件的内容经过哈希处理，并且仅当冲突发生在同一目录中的文件时才相关）。因此，推测大约 100,000 个潜在用户，比如 2^17，相当于 2^18 个“组”，假设每个用户平均有 2 个目录。因此，使用 40 位密钥，我可以预期在某个用户发生冲突之前（在所有用户中）创建 2^(20+9) 个文件。（或者 IOW 2^((40+18)/2)，由于“生日效应”。）在某处某个用户发生单一冲突之前，2^17 个用户平均为每个用户创建 4096 个唯一文件。然后在另一次碰撞发生之前很久（对吧？）

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

墨落画卷 2024-09-07 18:32:31

你的数学看起来很合理，但我想知道你为什么要为此烦恼。如果您想创建唯一的文件名，为什么不为每个用户分配一个编号，并为该用户保留一个序列号。当您需要文件名时，基本上只需将用户号与序列号连接起来（两者都填充到正确的位数）。如果您觉得需要混淆这些数字，请通过 40 位加密运行该结果（这将保证唯一的输入产生唯一的输出）。

例如，如果您为每个文档分配 20 位，则可以让 2²⁰ 个用户分别创建 2²⁰ 个文档，而不会发生任何冲突。

如果您不介意对其进行序列化访问，则可以只使用单个 40 位计数器。这样做的优点是，单个用户不会立即用完 2²⁰ 个序列号，尽管普通用户不太可能创建几乎那么多的文档。

同样，如果您认为由于某种原因需要混淆这个数字，您可以在计数器模式下使用 40 位加密算法（即使用序列号，但对其进行加密），这（再次）保证每个输入映射到唯一的输出。这可以保证不会发生冲突，直到/除非您的用户创建 2⁴⁰ 个文档（即仅使用 40 位的最大可能值）。或者，您可以创建一个 40 位全范围线性反馈移位寄存器来创建伪随机 40 位数字。这可能安全性稍差，但优点是实施起来更快、更简单。