当前位置：文江博客话题详情

C++ OpenGL 的性能怪异

发布于 2024-11-14 11:26:15 字数 564 浏览 3 评论 0原文

我正在用 C++ 重写一些渲染 C 代码。旧的 C 代码基本上计算它需要的所有内容并在每一帧渲染它。新的 C++ 代码会预先计算所需内容并将其存储为链接列表。

现在，实际的渲染操作是平移、颜色更改和对 GL 列表的调用。

虽然执行链表中的操作应该非常简单，但结果方法调用似乎比旧版本花费的时间更长（它每次都计算所有内容 - 我当然确保新版本不会重新计算）。

奇怪的是？与旧版本相比，它执行的 OpenGL 操作更少。但事情变得更奇怪了。当我为每种类型的操作添加计数器，并在方法末尾添加一个很好的旧 printf 时，它变得更快 - gprof 和手动测量都证实了这一点。

我还费心查看了 G++ 在这两种情况下生成的汇编代码（有跟踪和没有跟踪），并且没有重大变化（这是我最初的怀疑）——唯一的区别是为计数器分配了更多的堆栈字，增加所述计数器，并为 printf 做准备，然后跳转到它。

此外，这对于 -O2 和 -O3 都适用。我在 Ubuntu Maverick 上使用 gcc 4.4.5 和 gprof 2.20.51。

我想我的问题是：发生了什么事？我做错了什么？是否有什么东西影响了我的测量值和 gprof？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

多彩岁月 2024-11-21 11:26:15

通过花时间在 printf 上，您可能会避免下一次 OpenGL 调用中的停顿。

回复收藏 0 原文

咆哮 2024-11-21 11:26:15

如果没有更多信息，很难知道这里发生了什么，但这里有一些提示：

您确定 OpenGL 调用是相同的吗？您可以使用一些工具来比较发出的呼叫。确保没有因可能不同的完成顺序而导致状态发生变化。
您是否尝试过在运行时使用分析器？如果您有许多对象，那么在循环列表时追逐指针的简单事实可能会导致缓存未命中。
您是否已确定 CPU 端或 GPU 端的特定瓶颈？

这是我自己对可能出现问题的猜测。发送到 GPU 的调用需要一些时间才能完成：之前的代码通过混合 CPU 操作和 GPU 调用，使 CPU 和 GPU 并行工作；相反，新代码首先让 CPU 在 GPU 空闲时计算许多事情，然后在 CPU 无事可做时将所有需要完成的工作提供给 GPU。

回复收藏 0 原文

~没有更多了~

关于作者

俏︾媚

暂无简介

文章

27 人气

关注发私信

友情链接

文江博客

C++ OpenGL 的性能怪异

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

梦途

成熟稳重的好男人

蓝眼睛不忧郁

134fengkuang

yang18

属性

友情链接

C++ OpenGL 的性能怪异

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

梦途

成熟稳重的好男人

蓝眼睛不忧郁

134fengkuang

yang18

属性

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。