OpenGL - 顶点结构与 32 字节对齐？

发布于 2024-10-15 17:58:53 字数 265 浏览 9 评论 0原文

我读到，如果将顶点数据对齐为 32 字节，某些显卡会受益。

这通常涉及添加填充：

typedef struct {
  float x, y, z;
  int padding[5];
} Vertex;

但我一直想知道，这是否也意味着您应该分配要对齐到 32 字节的数据（malloc 对齐到 1 字节）？意思是指向数据的指针会平均分为 32 份？有关系吗？

（我正在将此数据上传到VBO）

谢谢

原文

I have read that some graphics cards benefit if you align your vertex data to be 32 bytes.

This usually involves adding padding:

typedef struct {
  float x, y, z;
  int padding[5];
} Vertex;

But I have been wondering, does this also mean you should allocate the data to be aligned to 32-bytes (malloc aligns to 1-byte)? Meaning the pointer to the data would divide evenly into 32? Does it matter?

(I am uploading this data to a VBO)

Thanks

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

梦回梦里 2024-10-22 17:58:53

通常，如果源内存对齐（目标内存通常也是对齐的），从客户端内存到 VBO 的复制操作会更快。这在某种程度上取决于您如何上传到 VBO。

也就是说，上传将是唯一因对齐而得到提升的事情。一旦内存位于 VBO 中，VBO 服务器内存的对齐（您无法控制）就很重要（GL 实现知道这一点，并且它们确实会对齐 VBO 内存）。

哦，带有 20 字节填充的 32 字节不会比带有 4 字节填充的 16 字节更快。重要的是你有一个二次方的大小，这样单个完整的顶点获取就不会跨越缓存行。

最后，malloc 不与 1 字节对齐。它至少符合基本类型的最低对齐要求，在大多数平台上为 8。

回复收藏 0 原文

~没有更多了~

关于作者

圈圈圆圆圈圈

暂无简介

文章

27 人气

关注发私信

qq_VRzBBA45

文章 0 评论 0

关注

痴情

文章 0 评论 0

关注

。

文章 0 评论 0

关注

Mu.

文章 0 评论 0

关注

凉薄对峙

文章 0 评论 0

关注

不落城

文章 0 评论 0

友情链接

文江博客

OpenGL - 顶点结构与 32 字节对齐？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

qq_VRzBBA45

痴情

。

Mu.

凉薄对峙

不落城

友情链接

OpenGL - 顶点结构与 32 字节对齐？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

qq_VRzBBA45

痴情

。

Mu.

凉薄对峙

不落城

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。