当前位置：文江博客话题详情

DirectX/Cuda/OpenGL 可访问的总内存/纹理内存

发布于 2024-09-12 10:35:56 字数 464 浏览 9 评论 0原文

有人可以解释一下 Cuda 上下文中使用的纹理内存与 DirectX 上下文中使用的纹理内存的区别吗？假设一个显卡有512MB的标称内存，它是如何划分为常量内存/纹理内存和全局内存的。

例如，我有一张特斯拉卡，通过 cudaGetDeviceProperties 查询，totalConstMem 为 64KB，totalGlobalMem 为 4GB，但没有变量告诉我需要多少纹理内存。

另外，通过 DirectX 等图形 API 访问时，“纹理内存”有多少。我没有这些 API 的编程经验，所以我不知道它们如何访问以及访问什么样的内存。但据我所知，所有访问的内存都是硬件缓存的。如果我错了，请纠正我。

在 KoppeKTop 的回答之后：那么在 CUDA 和 DirectX 的情况下，共享内存是否充当纹理内存的自动缓存？无论如何，我不认为拥有另一个硬件缓存是有意义的。这是否也意味着如果我在内核中使用整个共享内存，纹理内存将不会被缓存？

谢谢。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

不甘平庸 2024-09-19 10:35:56

事实上，我从未接触过 DirectX，但我可以用 CUDA 纹理来解释这种情况。纹理是具有缓存只读访问权限的简单数组（cudaArray 或倾斜数组），存储在全局内存中。因此，512 MB 卡上一个大纹理的最大大小为 512 Megs（实际上稍微小一点，但还不够）。它针对访问 2D 空间中的数据进行了优化（它被缓存为 2D 切片）。坐标和值也可以在访问时进行转换（有关详细信息，请参阅 CUDA 编程指南）。

不，并非所有内存都会在访问时缓存（对于具有计算能力 1.x 的 CUDA 设备）。只有常量和纹理内存。计算能力 >= 2.0 (Fermi) 的设备使用 L1 和 L2 缓存（或仅 L2 - 可配置）缓存所有内存访问。

回复收藏 0 原文