当前位置：文江博客话题详情

Virtual performance c++

vftable 性能损失 vs. switch 语句

发布于 2024-10-08 09:26:43 字数 385 浏览 3 评论 0原文

C++问题在这里。我有一个系统，其中将拥有给定超类的数百个迷你子类。它们都会有一个“foo”方法来执行某些操作。或者...我将有一个带有名为“type”的整数的类，并使用一个巨大的 switch 语句来决定当我 foo 时要做什么。

性能是这里的一个重要考虑因素。极其重要。

问题是，与让 C++ 通过 vftable 执行 switch 语句相比，使用 switch 语句的性能优势/劣势是什么？如果我将它作为 switch 语句，我可以将常见的 foo 放在 switch 语句的顶部，而不太常见的放在底部，希望能缩短比较的时间。即使我能弄清楚如何做到这一点，尝试使用 vftable 获得这样的效果也必然依赖于编译器......

另一方面，如果没有这些丑陋的 switch 语句，我的代码会更容易处理。

收藏 0

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

评论（5）

云淡月浅 2024-10-15 09:26:43

在虚拟机设计领域已经有一些关于这个主题的研究。一般来说，switch 语句会更快，许多虚拟机使用 switch 语义而不是虚拟查找。从理论上讲，人们会假设虚拟表（作为一种恒定时间算法）会更快，但我们必须检查硬件如何看待虚拟表。

switch 语句更容易让编译器内联。这是一个巨大的考虑因素，调用虚拟函数的实际行为很少，但是，推入和弹出整个堆栈帧是必要的，因为编译器不知道在运行时将调用哪个函数。

尽管现代架构在预测虚拟调用方面做得越来越好，但 switch 语句上的分支预测和硬件预取应该更容易。

许多使用虚拟调度的代码需要使用基于堆的分配方案。动态内存分配是许多 C++ 应用程序的瓶颈。

回复收藏 0 原文

通知家属抬走 2024-10-15 09:26:43

如果我将它作为 switch 语句，我可以将常见的 foo 放在 switch 语句的顶部，将不太常见的放在底部，希望能简化比较。

switch 语句通常编译为跳转表，而不是正如您的问题所暗示的那样，是一个 if-else 条件块。在实践中，虚拟表和 switch 跳转表应该具有相似的性能，但如果您真的担心的话，请进行测试。

回复收藏 0 原文

茶色山野 2024-10-15 09:26:43

编译器决定如何处理 switch 语句，但它们使用了一些基本技术。

if-else 二进制排序：比较是作为一系列 if-else 完成的，但以类似二进制排序的方式进行，因此性能与在 N 个项目
跳转表的映射中查找相当：如果项目足够接近，则将生成地址表。查找的时间是恒定的，

case 语句位于 switch 语句中的情况在任何一种情况下都没有区别。

与直接调用相比，虚函数有一定的开销。它涉及额外的偏移量和指针查找。对于除了最极端的性能考虑之外的所有情况，此成本可以忽略不计。与交换机相比，开销不在于虚拟查找，而在于函数调用本身。因此，在每种情况下仅调用函数的 switch 语句的执行效果与虚拟函数基本相同。

因此，与虚拟函数调用相比，switch 语句（带有跳转表）的“调度语义”本质上几乎是无关紧要的。如果所有“foo”方法都相对较小并且可以内联，则 switch 语句将开始执行得更好。 switch 的另一个优点是您可以将通用代码放在 switch 之前并获得更好的寄存器/堆栈优化。

然而，存在大量的维护开销。这应该是您此时最关心的问题。为什么？因为代码中的性能瓶颈不太可能是切换登录，甚至不是函数调用，而是其他东西。在解决其他问题之前，解决这些低级性能问题是没有意义的。因此，请坚持使用目前提供更可维护代码的那个。

回复收藏 0 原文

ゞ花落谁相伴 2024-10-15 09:26:43

对于这里的其他答案，我想再添加两个。

1) 对于编译器来说，跨虚拟函数调用接口执行经典优化（包括注册）比跨单个函数中 switch 语句中的 case 标记语句更困难且不太常见。

2) 调度中的任何性能差异都高度依赖于处理器的分支预测硬件。即使是虚拟函数调用目标地址（和返回）也可以被正确预测，并且在现代乱序处理器的管道中具有可以忽略不计的性能开销。

如果此操作的性能确实很重要，那么您确实必须在真实系统的上下文中尝试两种方法并对其进行测量。

快乐黑客！

回复收藏 0 原文

你爱我像她 2024-10-15 09:26:43

Vtable 在几乎所有情况下都应该更快，但如果性能如此关键，正确的问题是快多少。

Vtable调用是三重间接寻址（三次内存访问以获得目标CALL地址）。如果有很多调用，缓存未命中应该不是问题。因此，大约需要 2-3 次开关标签比较（尽管后者 CPU 缓存未命中的机会更少，但管道使用的机会更少）。

当然，您不应该依赖我在这里所说的任何内容，并在您的目标架构上使用真实的性能测量来测试所有内容。

回复收藏 0 原文

~没有更多了~

关于作者

一笔一画续写前缘

暂无简介

0 文章

0 评论

718 人气

关注发私信

相关话题

热门标签

操作系统程序设计 IT运维 Linux系统管理 JavaScript 服务器应用 solaris C/C++ PHP Shell BSD Vue.js aix Oracle Python HTML 系统管理 HTML5 CSS 前端

推荐作者

苦中寻乐

文章 0 评论 0

lueluelue

文章 0 评论 0

嗼ふ静

文章 0 评论 0

王权女流氓

文章 0 评论 0

与花如笺

文章 0 评论 0

残酷

文章 0 评论 0

友情链接

我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的隐私政策了解更多相关信息。单击 接受 或继续使用网站，即表示您同意使用 Cookies 和您的相关数据。

原文