AMD 64 位双核优化

发布于 2024-07-04 17:20:20 字数 279 浏览 19 评论 0原文

我们有一个图形密集型应用程序，它似乎在 AMD 64 位双核平台上遇到了一些问题，而这些问题在 Intel 平台上并不明显。

运行应用程序会导致 CPU 以 100% 的速度运行，特别是在使用阴影和照明代码 (Open GL) 时。

有谁知道 AMD 处理器可能导致此问题的具体问题，或者知道在哪里查找问题，和/或优化代码库以避免这些问题的方法？

注意，该应用程序通常在中档硬件上运行良好，我的开发机器有一个 nvidia gtx260 卡，因此电源不足应该不是问题

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

々眼睛长脚气 2024-07-11 17:20:20

我会投资分析软件来追踪问题的实际原因。

在 Linux 上，Valgrind（包含 Cachegrind 和 Callgrind）+ KCacheGrind 可以找出所有繁重的函数调用发生的位置。

此外，使用完整的调试符号进行编译，它甚至可以在慢速函数调用时显示汇编代码。

如果您使用的是英特尔特定编译器，这可能是您问题的一部分（但不是确定的），请尝试 GCC 系列。

此外，如果您还没有深入了解 OpenMP 和线程，您可能还想深入了解。

回复收藏 0 原文

长梦不多时 2024-07-11 17:20:20

嗯 - 如果您使用阴影，GPU 应该处于负载状态，因此 GPU 渲染帧的速度不可能比 CPU 发送图形数据的速度快。在这种情况下，100% 负载是可以的，甚至是预期的。

它可能只是一个无聊的 OpenGL 驱动程序，确实在某个地方的自旋锁中消耗了 CPU 周期。要了解到底发生了什么，我建议您运行一个分析工具，例如 AMD 的 Code Analyst（我上次使用它时免费的）。

花几分钟分析一下你的程序，看看时间都花在哪里了。如果您在 opengl 驱动程序中看到一个大峰值，而不是在您的应用程序中看到一个大峰值，请获取新的驱动程序。否则你至少知道发生了什么。

顺便说一句 - 让我猜一下，您使用的是 ATI 卡，对吧？我不想冒犯任何 ATI 粉丝，但他们的 OpenGL 驱动器并不十分出色。如果您不幸运，您甚至可能使用该卡不支持的功能或由于芯片错误而被禁用的功能。在这种情况下，驱动程序将回退到软件光栅化模式。即使您的程序是单线程的，这也会大大减慢速度并给您带来 100% 的 CPU 负载。

回复收藏 0 原文

酒几许 2024-07-11 17:20:20

根据您完成阴影和其他图形代码的方式，您可能已经“脱离了快速路径”并且图形驱动程序已开始进行软件模拟。如果您有复杂的管道，或者在着色器代码中使用太多条件（或太多指令），则可能会发生这种情况。

我会确保这个特定的显卡支持您正在使用的所有功能。

回复收藏 0 原文

农村范ル 2024-07-11 17:20:20

迟到的答案在这里。

不知道这是否相关，但在某些 win32 OpenGL 驱动程序中，SwapBuffers() 在等待 vsync 时不会让出 CPU，因此很容易获得 100% CPU 利用率。

我使用的解决方案是测量自上次 SwapBuffers() 完成以来的时间，这告诉我下一个垂直同步还有多远。因此，在调用 SwapBuffers() 之前，我会进行短暂的 Sleep() 操作，直到检测到即将发生垂直同步为止。这样 SwapBuffers() 就不必等待 vsync 很长时间，因此不会过度占用 CPU。

请注意，您可能必须使用 timeBeginPeriod() 来获得足够的 Sleep() 精度，才能可靠地工作。

回复收藏 0 原文