使用加密弱伪随机生成器进行模糊测试是不明智的吗？

发布于 2024-10-26 15:31:08 字数 337 浏览 4 评论 0原文

在开发大型软件项目时，我经常使用模糊测试作为测试用例的一部分，以帮助排除仅在输入达到特定大小或形状时才可能出现的错误。我最常通过使用与我正在使用的编程语言捆绑在一起的标准随机数工具来完成此操作。

最近，我开始想知道，忽略一般模糊测试的优点或缺点，在进行模糊测试时使用非加密安全伪随机数生成器是否是一个好主意。弱随机数生成器通常会表现出将其与真正的随机序列区分开来的模式，即使这些模式并不明显。使用弱 PRNG 的模糊测试似乎总是无法触发某些仅在某些情况下才会出现的潜在错误，因为伪随机数可能以一种永远不会触发这些情况的方式相互关联。

使用弱 PRNG 进行模糊测试本质上是不明智的吗？如果理论上这样做不合理，那么实践中还合理吗？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

毁梦 2024-11-02 15:31:08

您混淆了两种截然不同的“弱点”等级：

统计弱点意味着 PRNG 的输出表现出统计模式，例如某些序列比其他序列出现的频率更高。在某些极少数情况下，这实际上可能会导致模糊测试无效。统计上强大的 PRNG 具有高性能且广泛可用（最著名的是 Mersenne Twister）。
加密弱点意味着 RNG 的输出在某种程度上是可预测的，除了种子之外的知识（例如输出本身）。要求用于模糊测试的 PRNG 具有强加密性是绝对没有意义的，因为如果您需要防止精通密码学的攻击者，统计上强但加密性弱的 PRNG 所表现出的“模式”几乎只是一个问题从预测输出。

回复收藏 0 原文

心舞飞扬 2024-11-02 15:31:08

我认为这并不重要，但我无法证明这一点。

模糊测试只会尝试一些输入，在大多数情况下只尝试一小部分可能性。无论您使用的 RNG 有多好，它都可能会或可能不会找到破坏您代码的输入之一，具体取决于所有可能输入破坏您代码的比例。除非 PRNG 中的模式非常简单，否则在我看来，它不太可能以任何方式对应于您正在寻找的“坏”输入中的模式，因此它不会或多或少地命中它，而不是真正的随机。

事实上，如果您知道如何选择 RNG 来最大程度地提高找到错误输入的概率，您可能可以利用这些知识来帮助更直接地找到错误...

我认为您不应该使用糟糕的 PRNG。例如，rand 可以表现出非常简单的模式，例如 LSB 交替。如果您的代码在内部使用 PRNG，您可能希望避免在测试中以类似的方式使用相同的 PRNG，只是为了确保您不会意外地仅测试输入数据与内部生成的数字流匹配的情况！当然，风险很小，因为你希望他们使用不同的种子，但仍然如此。

在给定的语言中找到加密或至少安全的哈希库通常并不难。 SHA-1 无处不在，并且易于使用来生成流，否则 RC4 很容易实现。两者都提供了相当好的 PRNG，尽管不如 Blum Blum Shub 那么安全。我认为主要关心的是速度 - 例如，如果 Mersenne Twister 可以以 10 倍的速度生成模糊测试用例，并且被测试的代码相当快，那么它可能有更好的机会在给定的情况下找到错误的输入时间，无论给定 624 个输出，您都可以推断出 RNG 的完整状态...

回复收藏 0 原文