我很惊讶这个主题或 Jason Baker 链接的主题中没有人 提到的
蒙特卡罗测试。 这是我唯一一次广泛使用随机测试输入。 然而,通过为每个测试用例的随机数生成器提供恒定的种子,使测试具有可重复性非常重要。

心房敞 2024-07-22 02:24:55


(2) 我使用测试作为代码文档的一种形式。 如果我有硬编码的夹具值,则很难揭示特定测试试图演示的内容。

我同意。 理想情况下,规范示例本身应该是可以理解的。 使用装置是有问题的,因为它将示例的前提条件与其预期结果分开。

因此,许多 RSpec 用户已经完全停止使用灯具。 相反,在规范示例本身中构造所需的对象。

describe Item, "#most_expensive" do
  it 'should return the most expensive item' do
    items = [
      Item.create!(:price => 100),
      Item.create!(:price => 50)

    Item.most_expensive.price.should == 100

如果您最终有大量用于创建对象的样板代码,您应该查看一些测试对象工厂库,例如 factory_girl机械师FixtureReplacement

秋千易 2024-07-22 02:24:55

我们在我最近的一个项目中对此进行了很多思考。 最后,我们确定了两点:

  • 测试用例的可重复性至关重要。 如果您必须编写随机测试,请准备好广泛记录它,因为如果/当它失败时,您将需要确切地知道原因。
  • 使用随机性作为代码覆盖率的拐杖意味着您要么没有良好的覆盖率,要么您对领域的了解不足以了解代表性测试用例的构成。 找出哪个是正确的并相应地修复它。

总而言之,随机性往往带来的麻烦大于其价值。 在扣动扳机之前,请仔细考虑是否会正确使用它。 我们最终认为随机测试用例总体来说是一个坏主意,并且应该谨慎使用(如果有的话)。

寄居者 2024-07-22 02:24:55

已经发布了很多好的信息,但另请参阅:模糊测试。 据传闻,微软在他们的许多项目中都使用了这种方法。

柠檬 2024-07-22 02:24:55

我的测试经验主要是用 C/Python/Java 编写的简单程序,所以我不确定这是否完全适用,但每当我有一个可以接受任何类型的用户输入的程序时,我总是包含一个测试随机输入数据,或者至少是计算机以不可预测的方式生成的输入数据,因为您永远无法假设用户将输入什么。 或者,你可以,但如果你这样做,那么一些没有做出这种假设的黑客很可能会发现你完全忽视的错误。 机器生成的输入是我所知道的将人类偏见完全排除在测试程序之外的最佳(唯一?)方法。 当然,为了重现失败的测试,您必须在运行测试之前执行一些操作,例如将测试输入保存到文件或将其打印出来(如果是文本)。

My experience with testing is mostly with simple programs written in C/Python/Java, so I'm not sure if this is entirely applicable, but whenever I have a program that can accept any sort of user input, I always include a test with random input data, or at least input data generated by the computer in an unpredictable way, because you can never make assumptions about what users will enter. Or, well, you can, but if you do then some hacker who doesn't make that assumption may well find a bug that you totally overlooked. Machine-generated input is the best (only?) way I know of to keep human bias completely out of the testing procedures. Of course, in order to reproduce a failed test you have to do something like saving the test input to a file or printing it out (if it's text) before running the test.

一腔孤↑勇 2024-07-22 02:24:55

只要您没有解决oracle 问题(即根据输入确定软件的预期结果)的解决方案,随机测试就是一种不好的做法。

如果你解决了预言机问题,你就可以比简单的随机输入生成更进一步。 您可以选择输入分布,以便软件的特定部分比简单的随机分布得到更多的锻炼。


if (a > 0)
    // Do Foo
else (if b < 0)
    // Do Bar
    // Do Foobar

如果您在 int 范围内随机选择 ab,则您有 50% 的时间锻炼 FooBar 占 25% 的时间,Foobar 占 25% 的时间。 您可能会在 Foo 中发现比 BarFoobar 中更多的错误。

如果您选择 a,使其在 66.66% 的情况下为负,则 BarFoobar 会比您的第一个分布得到更多运用。 事实上,这三个分支各有 33.33% 的时间得到行使。


暮光沉寂 2024-07-22 02:24:55


http://github.com/notahat/machinist/tree/master< /a>

Machinist 将为您生成数据,但它是可重复的,因此每次测试运行都有相同的随机数据。


百思不得你姐 2024-07-22 02:24:55


我强烈建议使用 Factory Girl 和 ffaker 来实现此目的。 (在任何情况下都不要使用 Rails 固定装置。)

浅唱ヾ落雨殇 2024-07-22 02:24:55


爱,才寂寞 2024-07-22 02:24:55


赤濁 2024-07-22 02:24:55

此类测试的有效性很大程度上取决于您使用的随机数生成器的质量以及将 RNG 的输出转换为测试数据的代码的正确性。

如果 RNG 从未产生导致您的代码进入某些边缘情况的值,那么您将不会涵盖这种情况。 如果将 RNG 的输出转换为您测试的代码的输入的代码有缺陷,则即使使用良好的生成器,您仍然可能无法满足所有边缘情况。


李不 2024-07-22 02:24:55



如果您发现某些东西损坏了,那么从那时起您每次都需要包含该测试,否则您将不会有一组一致的测试。 另外,如果您运行有效的随机测试,那么您需要包含该测试,因为您可能会破坏代码,从而导致测试失败。

换句话说,如果您有一个使用动态生成的随机数据的测试,我认为这是一个坏主意。 但是,如果您使用一组随机数据,然后存储并重复使用,这可能是一个好主意。 这可以采用随机数生成器的一组种子的形式。



深空失忆 2024-07-22 02:24:55


人们反对它的最大论点是它破坏了测试用例的确定性。 然而,这实际上并不是一个问题,只要您的测试用例可以确定性失败。 问题是当你的测试由于随机数据而变得不稳定时。


  • 解决与数据相关的冲突。 例如,夹具工厂通过使用随机生成的 UUID 自动解决字段的唯一约束。
  • 由于样板代码减少,测试用例可维护。 当您想要测试 x 时,让我们只关注 x 而不是它的依赖项。
  • 模糊测试。 在这种情况下,您想要数据甚至噪声的随机组合。

