平滑渲染 1.2 GB 纹理，1 GB GPU 是如何做到的？

发布于 2024-12-02 21:24:15 字数 499 浏览 3 评论 0原文

我的目标是看看当使用的纹理数据多于物理 GPU 内存所能容纳的数量时会发生什么。我的第一次尝试是加载最多 40 个 DDS 纹理，导致内存占用量远高于 GPU 内存。然而，我的场景在 9500 GT 上仍会以 200+ fps 的速度渲染。

我的结论是：GPU/OpenGL 很聪明，只将 mipmap 的某些部分保留在内存中。我认为这在标准配置上是不可能的，但无论如何。

第二次尝试：禁用 mip 映射，以便 GPU 始终必须从高分辨率纹理中进行采样。我再次在内存中加载了大约 40 个 DDS 纹理。我使用 gDEBugger 验证了纹理内存使用情况：1.2 GB。尽管如此，我的场景仍以 200+ fps 的速度渲染。

我唯一注意到的是，当将镜头移开然后再次将其置于场景中心时，会出现严重的滞后。好像只有这样它才会将纹理从主内存传输到 GPU。（我启用了一些基本的视锥体剔除）

我的问题：发生了什么事？这个 1 GB GPU 如何以 200+ fps 的速度从 1.2 GB 纹理数据中采样？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

暖阳 2024-12-09 21:24:15

OpenGL 可以在绘制调用之间（不仅仅是在帧之间）将完整的纹理分页进出纹理内存。只有当前绘制调用所需的那些实际上需要驻留在图形内存中，其他的可以驻留在系统 RAM 中。它可能只对纹理数据的一小部分进行此操作。它与任何缓存几乎相同 - 当 CPU 上只有 MB 的缓存时，如何在 GB 的数据上运行算法？

此外，PCI-E 总线具有非常高的吞吐量，因此您不会真正注意到驱动程序执行分页。

如果您想验证这一点，glAreTexturesResident 可能有帮助，也可能没有帮助，具体取决于驱动程序的实现程度。

回复收藏 0 原文

∞琼窗梦回ˉ 2024-12-09 21:24:15

即使您在测试中强制进行纹理抖动（每帧丢弃一些纹理并从系统内存上传到 GPU 内存）（我不确定您是否这样做），现代 GPU 和 PCI-E 具有如此巨大的带宽，以至于某些抖动确实对性能有那么大的影响。其中一款 9500GT 型号的带宽为 25.6 GB/s，16 个 PCI-E 插槽（500 MB/sx 16 = 8 GB/s）是标准配置。

至于延迟，我假设 GPU + CPU 在您不绘制可见纹理时会降低功耗，而当您突然超载时，它们需要短暂的瞬间启动。在现实生活中的应用程序和游戏中，这种 0%-100% 的突然工作负载变化永远不会发生，因此我想，轻微的滞后是完全可以理解和预期的。

回复收藏 0 原文

~没有更多了~