当前位置：文江博客话题详情

Java的UUID.randomUUID有多好？

发布于 2024-08-27 05:33:19 字数 299 浏览 15 评论 0原文

我知道随机 UUID 理论上发生碰撞的概率非常非常低，但我我想知道，在实践中，Java 的有多好randomUUID() 是指没有碰撞吗？有人有经验可以分享吗？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

空宴 2024-09-03 05:33:19

UUID 使用 java.security.SecureRandom，这应该是“加密强度高”。虽然实际的实现没有指定，并且在 JVM 之间可能有所不同（这意味着所做的任何具体语句仅对一种特定的 JVM 有效），但它确实要求输出必须通过统计随机数生成器测试。

一个实现总是有可能包含破坏这一切的微妙错误（请参阅 OpenSSH 密钥生成错误），但我认为没有任何具体理由担心 Java UUID 的随机性。

回复收藏 0 原文

时常饿 2024-09-03 05:33:19

维基百科有一个很好的答案
http://en.wikipedia.org/wiki/Universally_unique_identifier#Collisions

为了有 50% 的概率发生至少一次冲突，需要生成随机版本 4 UUID 的数量为 2.71 quintillion，计算如下：
...
这个数字相当于在大约 85 年里每秒生成 10 亿个 UUID，而包含这么多 UUID 的文件（每个 UUID 16 字节）将约为 45 艾字节，比当前存在的最大数据库大很多倍，数量级为数百 PB。
...
因此，为了保证十亿分之一的重复概率，必须生成 103 万亿个版本 4 UUID。

回复收藏 0 原文

挽清梦 2024-09-03 05:33:19

有人有经验可以分享吗？

类型 4 UUID 有 2^122 个可能的值。（规范规定类型会丢失 2 位，版本号会丢失 4 位。）

假设您每秒生成 100 万个随机 UUID，那么在您的一生中发生重复的可能性将微乎其微。。要检测重复项，您必须解决每秒将 100 万个新 UUID 与您之前生成的所有 UUID¹ 进行比较的问题！

任何人在现实生活中经历过（即实际注意到）重复的机会甚至比消失还要小……因为寻找碰撞的实际困难。

当然，现在您通常会使用伪随机数生成器，而不是真正的随机数源。但我认为我们可以确信，如果您使用可靠的提供商来提供加密强度随机数，那么它将是加密强度，并且重复的概率将与理想情况相同（无偏）随机数生成器。

然而，如果您使用带有“损坏的”加密随机数生成器的 JVM，那么所有的赌注都将落空。（这可能包括某些系统上“熵不足”问题的一些解决方法。或者有人在您的系统或上游修改了您的 JRE 的可能性。）

^{1 - 假设您使用了“某些正如匿名评论者提出的“一种二进制 btree”，假设低密度和随机，每个 UUID 将需要 O(NlogN) 位 RAM 内存来表示 N 个不同的 UUID位的分布。现在将其乘以 1,000,000 以及您要运行实验的秒数。我认为这对于测试高质量 RNG 碰撞所需的时间长度来说并不实际。即使有（假设的）巧妙的表述也不行。}

回复收藏 0 原文

孤凫 2024-09-03 05:33:19

我不是专家，但我认为多年来有足够多的聪明人研究过 Java 的随机数生成器。因此，我还假设随机 UUID 是好的。所以你应该确实有理论碰撞概率（大约为 1 : 3 × 10^38所有可能的 UUID。有谁知道这对于随机 UUID 有何变化？是上述的 1/(16*4) 吗？）

根据我的实践经验，到目前为止我从未见过任何冲突。。当我得到第一个胡子的那天，我可能会长出惊人的长胡子；）

回复收藏 0 原文

寒尘 2024-09-03 05:33:19

在前雇主那里，我们有一个包含随机 uuid 的独特列。部署后第一周我们就发生了碰撞。当然，几率很低，但也不是零。这就是 Log4j 2 包含 UuidUtil.getTimeBasedUuid 的原因。只要您在单个服务器上生成的 UUID 数不超过 10,000 个/毫秒，它就会生成一个 8,925 年唯一的 UUID。

回复收藏 0 原文