当前位置：文江博客话题详情

如何衡量分支错误预测的影响？

发布于 2024-09-02 00:54:27 字数 99 浏览 3 评论 0原文

我目前正在分析二分搜索的实现。使用一些特殊指令来测量这一点，我注意到代码的错误预测率约为 20%。我很好奇是否有任何方法可以检查我可能因此而失去多少个周期。它是基于 MIPS 的架构。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

各自安好 2024-09-09 00:54:27

每次迭代会丢失 0.2 * N 个周期，其中 N 是在错误预测的分支之后刷新管道所需的周期数。假设 N = 10，那么这意味着每次迭代总共会损失 2 个时钟。除非您有一个非常小的内部循环，否则这可能不会对性能造成重大影响。

回复收藏 0 原文

小傻瓜 2024-09-09 00:54:27

在文档中查找适合您的 CPU 的信息。如果您无法具体找到此信息，则 CPU 管道的长度是一个相当不错的估计。

鉴于它是 MIPS 并且是 300MHz 系统，我猜测它的管道相当短。可能有 4-5 个阶段，因此每次错误预测花费 3-4 个周期的成本可能是合理的猜测。

回复收藏 0 原文

街角卖回忆 2024-09-09 00:54:27

您可以将近似错误预测成本计算为错误预测数量和错误预测成本（通常是管道某些部分的函数）的乘积。

在有序 CPU 上， ://en.wikipedia.org/wiki/Out-of-order_execution" rel="nofollow noreferrer">乱序 CPU，但是，这样的一般计算通常是不可能的。 Flight¹ 中可能有大量指令，其中只有部分指令因错误预测而被刷新。周围的代码可能受到一个或多个相关指令链的延迟限制，或者可能受到执行单元、重命名吞吐量等资源的吞吐量限制，或者可能介于两者之间。

在这样的核心上，即使在性能计数器的帮助下，每次错误预测的惩罚也很难确定。您可以找到整篇论文回到主题：发现整个基准测试的平均惩罚大小为 9 到 35 个周期：如果您查看一小段代码，范围会更大：零惩罚很容易证明，您可以创建一个惩罚为数百个周期的场景。

如果你只是想确定二分搜索中的错误预测成本，你会怎么办？一个简单的方法就是控制错误预测的数量并测量差异！如果您将基准输入设置为具有一系列行为，从始终遵循相同的分支模式开始，一直到具有随机模式，您可以绘制错误预测计数与运行时退化的关系。如果您这样做，请分享您的结果！

¹数百条现代大核（例如 x86、ARM 和 POWER 架构提供的核）正在运行的指令。