通过最小化着色器/状态更改来优化 WebGL 性能的指南

发布于 2024-10-09 02:55:18 字数 740 浏览 9 评论 0原文

我正在尝试了解 WebGL 在渲染由 100K 个三角形组成的大型室内场景方面的实用性。这些三角形分布在很多物体上，场景中也有很多材质。另一方面，没有活动部件。而且材质往往相当简单，主要基于纹理贴图。有很多纹理贴图共享..例如场景中的所有椅子将共享一个公共贴图。还有一些多重纹理 - 材质中最多叠加三个纹理。

我做了一些实验和阅读，发现在渲染过程中频繁切换材质会减慢速度。例如，假设每次显示一个对象时都会设置一个新材质，则具有 200K 个三角形的场景将具有显着的性能差异，具体取决于是否有 10 个或 1000 个对象。

因此，如果性能很重要，则场景应该按材质排序，以尽量减少材质切换。我正在寻找的是关于如何考虑各种状态更改的开销的指南，以及如何获得最大的收益。例如，

gl.useProgram()、gl.uniformMatrix4fv()、gl.drawElements() 的相对性能成本是多少>
我应该尝试编写 ubershaders 以最小化着色器切换吗？
我是否应该尝试聚合几何图形以尽量减少 gl.drawElements() 调用的数量

我意识到里程可能会因浏览器、操作系统和图形硬件而异。我也不是在寻求英雄的措施。只是那些已经有一些快速制作场景经验的人提供的一些指导。我要补充一点，虽然我过去在固定管道 OpenGL 编程方面有一些经验，但我对 WebGL/OpenGL ES 2.0 的处理方式相当陌生。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

梦亿 2024-10-16 02:55:18

您读过批量、批量、批量吗？诚然，它关注的是 directX，但其推理在较小程度上也适用于 Open/WebGL：每个 API 调用都会对 CPU 产生显着的开销。建议使用所有 API 选项来共享纹理、使用实例化（如果可用）、编写复杂的着色器以避免多次绘制调用。因此，如果您可以在一次调用中将整个房子绘制为单个网格，那么这将比每个房间 1000 次调用要好。建议编写 ubershaders，但主要是因为它可以允许您删除绘制调用，而不是因为 GPU 状态切换成本高昂。

这假设了最新的硬件。对于低端平台（iPad？）或英特尔 GMA 芯片，瓶颈将在其他地方（例如软件顶点处理）。

回复收藏 0 原文

~没有更多了~