对 2D 数组使用纹理缓存/Image2D 的缺点？

发布于 2024-12-02 04:57:48 字数 297 浏览 1 评论 0原文

当访问全局内存中的 2D 数组时，使用纹理缓存有很多好处，例如过滤并且不必太关心内存访问模式。 CUDA 编程指南仅指出了一个缺点：

但是，在同一内核调用中，纹理缓存与全局内存写入并不保持一致，因此对同一内核调用中通过全局写入写入的地址的任何纹理提取都会返回未定义的数据.

如果我不需要这样做，因为我从不写入我读取的内存，那么使用纹理缓存（或 Image2D，因为我在 OpenCL 中工作）而不是普通的全局缓存时是否有任何缺点/陷阱/问题记忆？在某些情况下，使用纹理缓存会降低性能吗？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

伪心 2024-12-09 04:57:48

纹理可以比“裸”全局内存访问更快、相同或更慢。使用纹理预测性能没有通用的经验法则，因为加速（或缺乏加速）是由代码中的数据使用模式和所使用的纹理硬件决定的。

在最坏的情况下，缓存命中率非常低，使用纹理比正常内存访问慢。每个线程必须首先发生缓存未命中，然后触发全局内存获取。由此产生的总延迟将高于直接从内存读取。我几乎总是为我正在开发的任何严肃代码编写两个版本，其中纹理可能有用（一种有，一种没有），然后对它们进行基准测试。通常可以开发启发式方法来根据输入选择要使用的版本。 CUBLAS 广泛使用这种策略。

回复收藏 0 原文

~没有更多了~