什么是具有统计显着性的延迟变化？

发布于 2024-10-15 16:35:39 字数 633 浏览 8 评论 0原文

考虑这样的情况：我有四个相同的路由器 A、B、C 和 D，运行 busybox 和 ptpd。 A和B通过电缆1连接； C 和 D 通过电缆 2 连接。我在路由器 A 和 C 上有一个小 C 程序，它通过 UDP 向对面路由器发送一个非常小的数据包，我使用 pcap 来检测数据包发送的时间，以及时间它到达另一端，并计算一千个这样的测试的平均值和偏差。

如何判断这些电缆是否不同？显然，如果一个是500μs，另一个是10ms，它们是不同的。但是，如果一个结果的平均值为 200μs，标准偏差为 8，而另一个结果的平均值为 210μs，标准偏差为 10，该怎么办？它们不同的可能性有多大？我应该做哪些计算来测试这个？而且，从更技术性的角度来说，延迟的预期变化是多少？

我知道任何中间交换机、集线器、路由器等都会增加延迟和可变性，但如果它们通过单根电缆直接连接，正常方差是多少？

编辑：只是为了澄清一点 - 这不仅仅是一个统计问题。我可以使用 t 检验来确定差异的概率（谢谢），但我还想知道有多少差异通常可以归因于网络设备的不同质量。例如，如果两个平均值的平均值为 208.4 和 208.5，我会怀疑无论 t 检验可能会说什么，电缆都是相同的，差异来自于测试机器。还是我错了？电缆是否经常会有微小变化？我不知道 - 延迟之间的正常差异是多少？我需要进行哪些测试来区分电缆和设备的差异？（我无法切换电缆）

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

雨夜星沙 2024-10-22 16:35:39

首先，您需要了解统计假设检验的入门知识。

然后，有多种方法可以回答您的问题，但最经典的方法是考虑观察到的延迟是一个实数变量（我们将其称为时间 T），它具有由每根电缆的行为解释的非随机分量（让我们称这些为 C，代表电缆）和一个您无法解释的随机分量，它可能来自随机波动或您忘记考虑的其他因素（让我们称这些为 E，代表错误）。

然后，您将对电缆 AB 进行一系列观察，您的模型为：

T1_i = C1 + E1_i

您认为电缆的贡献保持固定，只有随机变量 E1 发生变化。

您还将对电缆 CD 进行一系列观察，您的模型是：

T2_i = C2 + E2_i

您认为电缆的贡献保持固定，只有随机变量 E2 发生变化。

现在，你已经基本解决了。您将确保消除所有系统影响，因此 E1 和 E2 确实是波动。在这些条件下，您可以假设它们是正态分布（高斯分布）。

使用此模型，您可以使用独立的双样本 t 检验来检查 C1 和 C2 是否与您事先设置的任何置信度不同。

回复收藏 0 原文

帅气称霸 2024-10-22 16:35:39

您想要的是两个样本 t 检验。您无需对您担心的典型方差做出任何假设，它们已内置于测试中。请在此处找到相应的 Wiki 页面。然而，统计上的不同并不一定等同于经济上的不同。您可以确认两个路由器之间的延迟时间确实不同，但差异足够大吗？在不了解更多情况的情况下很难说清楚你的情况，但要小心不要在统计杂草中走得太远。

回复收藏 0 原文

近箐 2024-10-22 16:35:39

老实说，我认为统计数据不会对你在这里所做的事情有很大贡献。收集数据的成本基本上为零，并且您可以收集任意大量的数据。通过每条电缆发射几百万/十亿个数据包，然后在两个具有相同比例的直方图上绘制延迟。如果您看不出差异，则可能没有任何意义。

摘要统计数据会破坏信息。无论如何，人们想要使用它们的原因有很多，但我认为它们在这里不会那么有用。如果你想学习统计数据，我当然对此表示赞赏 - 我认为统计素养对于那些希望能够辨别别人何时向他们胡说八道的人来说是一项基本技能。但如果您只是想了解这两条电缆之间的延迟差异，一对精心制作的直方图将提供更多信息。

回复收藏 0 原文

~没有更多了~