对生成随机输出的代码进行单元测试的最佳方法是什么？

发布于 2024-09-06 07:08:02 字数 492 浏览 3 评论 0原文

具体来说，我有一个方法从列表中选择 n 个项目，其中 a% 满足一个标准，b% 满足第二个标准，依此类推。一个简化的示例是选择 5 个项目，其中 50% 的给定属性值为“true”，50% 的值为“false”； 50% 的情况下，该方法会返回 2 个 true/3 个 false，而另外 50% 的情况下，会返回 3 个 true/2 个 false。

从统计上来说，这意味着超过 100 次运行，我应该得到大约 250 个 true/250 个 false，但由于随机性，240/260 是完全可能的。

对此进行单元测试的最佳方法是什么？我假设即使技术上 300/200 是可能的，但如果发生这种情况，测试可能会失败。对于此类情况是否存在普遍接受的容忍度？如果有，您如何确定那是什么？

编辑：在我正在编写的代码中，我没有使用伪随机数生成器的奢侈，也没有强制它随着时间的推移进行平衡的机制，因为挑选出的列表是在不同的生成器上生成的机器。我需要能够证明，随着时间的推移，符合每个标准的项目的平均数量将趋向于所需的百分比。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

梦亿 2024-09-13 07:08:02

随机和统计在单元测试中不受欢迎。单元测试应该始终返回相同的结果。总是。不是大部分。

您可以做的是尝试删除您正在测试的逻辑的随机生成器。然后您可以模拟随机生成器并返回预定义的值。

其他想法：

您可以考虑更改实现以使其更易于测试。尝试获得尽可能少的随机值。例如，您只能获得一个随机值来确定与平均分布的偏差。这很容易测试。如果随机值为零，您应该得到您期望的平均分布。例如，如果该值为 1.0，则您会因某个定义的因素而偏离平均值，例如 10%。您还可以实现一些高斯分布等。我知道这不是这里的主题，但如果您可以随意实现它，请考虑可测试性。

回复收藏 0 原文

网名女生简单气质 2024-09-13 07:08:02

根据您拥有的统计信息，确定一个范围而不是一个特定的单个值作为结果。

回复收藏 0 原文

浅笑依然 2024-09-13 07:08:02

例如科学计算中的许多概率算法使用伪-随机数生成器，而不是true随机数生成器。尽管它们不是真正随机的，但精心选择的伪随机数生成器也能很好地完成这项工作。

伪随机数生成器的优点之一是它们生成的随机数序列完全可重现。由于该算法是确定性的，因此相同的种子将始终生成相同的序列。这通常是首先选择它们的决定因素，因为实验需要可重复，结果需要可重现。

这个概念也适用于测试。组件可以设计为可以插入任何随机数源。为了进行测试，您可以使用始终播种的生成器。结果将是可重复的，适合测试。

请注意，如果实际上需要真随机数，您仍然可以通过这种方式进行测试，只要该组件具有可插入的随机数源即可。您可以将相同的顺序（如果需要的话可能是真正随机的）重新插入到相同的组件中进行测试。

回复收藏 0 原文

半枫 2024-09-13 07:08:02

在我看来，您至少要在这里测试三个不同的东西：

使用随机源生成输出的过程的正确性
随机源的分布是否符合您的预期
输出的分布是否符合您的预期Expect

1 应该是确定性的，您可以通过提供一组选定的已知“随机”值和输入并检查它是否产生已知的正确输出来对其进行单元测试。如果您构建代码以便将随机源作为参数传递而不是嵌入到代码中，这将是最简单的。

2和3不能绝对测试。您可以测试某些选定的置信水平，但必须做好此类测试在某些情况下失败的准备。也许您真正想要注意的是测试 3 的失败次数比测试 2 的失败次数要多得多，因为这表明您的算法是错误的。

要应用的测试将取决于预期的分布。对于 2，您很可能期望随机源是均匀分布的。有各种测试，具体取决于您想要参与的程度，请参阅例如在此页面上测试伪随机数生成器。

3 的预期分布很大程度上取决于您所生产的产品。问题中的简单 50-50 情况完全等同于测试公平硬币，但是显然其他情况会更复杂。如果您可以计算出分布应该是什么，卡方检验反对它可能会有所帮助。

回复收藏 0 原文

未蓝澄海的烟 2024-09-13 07:08:02

这取决于您对测试套件的使用。如果您因为接受测试驱动开发和积极的重构而每隔几秒钟运行一次，那么它不会虚假失败就非常重要，因为这会导致重大中断并降低生产力，因此您应该选择一个实际上不可能的阈值以达到良好的实施效果。如果您每晚运行一次测试并有一些时间来调查故障，您可以更加严格。

在任何情况下，您都不应部署会导致频繁出现未经调查的故障的东西 - 这违背了测试套件的全部目的，并大大降低了其对团队的价值。

回复收藏 0 原文

傲世九天 2024-09-13 07:08:02

您应该在“单个”单元测试中测试结果的分布，即在任何单独的运行中结果尽可能接近所需的分布。对于您的示例，结果是 2 true / 3 false 可以，4 true / 1 false 则不行。

您还可以编写执行该方法（例如 100 次）的测试，并检查分布的平均值是否“足够接近”所需的速率。这是一个边界情况 - 运行更大的批次可能需要大量时间，因此您可能希望将这些测试与“常规”单元测试分开运行。此外，正如 Stefan Steinegger 指出的那样，如果您将“足够接近”定义得更严格，这样的测试有时会失败，或者如果您将阈值定义得太宽松，则开始变得毫无意义。所以这是一个棘手的案子......

回复收藏 0 原文