当前位置：文江博客话题详情

CUDA中本地内存比共享内存慢吗？

发布于 2024-12-01 20:03:40 字数 186 浏览 1 评论 0原文

我只发现一个评论，本地内存比寄存器内存（每线程两个类型）慢。

共享内存应该很快，但是它比[线程的]本地内存快吗？

我想做的是一种中值过滤器，但使用给定的百分位而不是中值。因此，我需要从列表中取出一部分，对它们进行排序，然后选择一个合适的。但我无法开始对共享内存列表进行排序，否则就会出现问题。仅复制到本地内存会损失大量性能吗？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

东北女汉子 2024-12-08 20:03:40

本地内存只是线程本地全局内存。它比寄存器或共享内存慢得多（在带宽和延迟方面）。它还消耗内存控制器带宽，否则这些带宽可用于全局内存事务。溢出或故意使用本地内存对性能的影响可能轻微到严重，具体取决于您使用的硬件以及本地内存的使用方式。

根据 Vasily Volkov 的研究 - 请参阅较低占用率下的更好性能 (pdf）——Fermi GPU 上的共享内存和寄存器之间的有效带宽大约相差 8 倍（大约 1000 Gb/s）共享内存为 8000 Gb/s，寄存器为 8000 Gb/s）。这在某种程度上与 CUDA 文档相矛盾，该文档意味着共享内存的速度与寄存器相当。

回复收藏 0 原文

~没有更多了~