当前位置：文江博客话题详情

为什么对 UUID 进行 MD5 处理不是一个好主意？

发布于 2024-08-02 00:24:11 字数 573 浏览 2 评论 0原文

PHP 有一个 uniqid() 函数，可以生成某种 UUID。

在用法示例中，它显示以下内容：

$token = md5(uniqid());

但在注释中，有人这么说：

从唯一 ID 生成 MD5 是幼稚并降低了很多价值唯一的ID，以及提供显着的（可攻击的）限制 MD5 域。那是一个深深的破碎的事情要做。正确的方法是使用唯一的ID 它自己的; 它已经准备好了无碰撞。

如果是的话，为什么这是真的？如果 MD5 哈希对于唯一 ID 而言（几乎）是唯一的，那么对 uniqid 进行 md5 处理有什么问题呢？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

山人契 2024-08-09 00:24:11

UUID 为 128 位宽，并且其生成方式具有固有的唯一性。 MD5 哈希值的宽度为 128 位，不保证唯一性，仅保证较低的冲突概率。 MD5 哈希不小于 UUID，因此它对存储没有帮助。

如果您知道哈希值来自 UUID，则攻击会更容易，因为如果您了解有关生成 UUID 的机器的任何信息，则有效 UUID 的域实际上是相当可预测的。

如果您需要提供安全令牌，那么您需要使用加密安全随机数生成器。 (1) UUID 并非旨在加密安全，仅保证唯一。由唯一机器标识符（通常是 MAC）和时间限制的单调递增序列仍然是一个完全有效的 UUID，但如果您可以从令牌序列对单个 UUID 进行逆向工程，那么它是高度可预测的。

加密安全 PRNG 的定义特征是给定迭代的结果不包含足够的信息来推断下一次迭代的值 - 即生成器中存在一些未在数字中显示且无法推断的隐藏状态通过检查 PRNG 中的数字序列。
如果您了解数论，您可以找到从生成值序列猜测某些 PRNG 内部状态的方法。 Mersenne Twister 就是此类生成器的一个示例。它具有隐藏状态，它曾经获得很长的周期，但它在加密上并不安全 - 您可以采用相当小的数字序列并使用它来推断内部状态。完成此操作后，您可以使用它来攻击依赖于对该序列保密的加密机制。

回复收藏 0 原文

新人笑 2024-08-09 00:24:11

请注意，uniqid() 不会返回 UUID< /strong>，但是基于当前时间的“唯一”字符串：

$ php -r 'echo uniqid("prefix_", true);'
prefix_4a8aaada61b0f0.86531181

如果多次执行此操作，您将获得非常相似的输出字符串，并且熟悉 uniqid() 的每个人都会识别源算法。这样就可以很容易地预测下一个将生成的 ID。

md5() 的优点是输出以及特定于应用程序的盐字符串或随机数，是一种更难猜测字符串的方法：

$ php -r 'echo md5(uniqid("prefix_", true));'
3dbb5221b203888fc0f41f5ef960f51b

与普通的 uniqid() 不同，这会产生非常不同的输出微秒。此外，它不会揭示您的“前缀盐”字符串，也不会显示您在幕后使用 uniqid() 。在不知道盐的情况下，很难（认为不可能）猜测下一个 ID。

总之，我不同意评论者的观点，并且总是更喜欢使用 md5() 编辑的输出而不是简单的 uniqid()。

Note that uniqid() does not return a UUID, but a "unique" string based on the current time:

$ php -r 'echo uniqid("prefix_", true);'
prefix_4a8aaada61b0f0.86531181

If you do that multiple times, you will get very similar output strings and everyone who is familiar with uniqid() will recognize the source algorithm. That way it is pretty easy to predict the next IDs that will be generated.

The advantage of md5()-ing the output, along with an application-specific salt string or random number, is a way harder to guess string:

$ php -r 'echo md5(uniqid("prefix_", true));'
3dbb5221b203888fc0f41f5ef960f51b

Unlike plain uniqid(), this produces very different outputs every microsecond. Furthermore it does not reveil your "prefix salt" string, nor that you are using uniqid() under the hood. Without knowing the salt, it is very hard (consider it impossible) to guess the next ID.

In summary, I would disagree with the commentor's opinion and would always prefer the md5()-ed output over plain uniqid().

回复收藏 0 原文