当前位置：文江博客话题详情

Cuda 不同的内存分配

发布于 2024-10-06 08:58:19 字数 130 浏览 3 评论 0原文

我正在使用 CUDA 开发一个小型应用程序。
我有一个巨大的二维数组（不适合共享内存），其中所有块中的线程都将从随机位置不断读取。
这个二维数组是一个只读数组。
我应该在哪里分配这个二维数组？全局内存？恒定内存？纹理记忆？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

永言不败 2024-10-13 08:58:19

根据设备纹理内存的大小，您应该在此区域中实现它。事实上，纹理内存是基于顺序局部缓存机制的。这意味着当连续标识符的线程尝试访问相对较近的存储位置内的数据元素时，内存访问会得到优化。
此外，这里实现该局部性以用于2D访问。因此，当每个线程到达存储在纹理内存中的数组的数据元素时，就处于连续 2D 访问的情况。因此，您可以充分利用内存架构。

不幸的是，这个内存并不是那么大，并且使用巨大的数组，您也许可以将数据放入其中。在这种情况下，就无法避免使用全局内存。

回复收藏 0 原文

迷爱 2024-10-13 08:58:19

我同意 jHackTheRipper，一个简单的解决方案是使用纹理内存，然后使用计算视觉分析器进行分析。这是来自 NVIDIA 的一组很好的幻灯片，介绍了图像的不同内存类型卷积;它表明良好的共享内存使用和全局读取并不比使用纹理内存快太多。在您的情况下，您应该从 texmemory 中获得一些合并读取，而访问全局内存中的随机值通常不会获得这些读取。

回复收藏 0 原文