当前位置：文江博客话题详情

CUDA：什么是分散写？

发布于 2024-08-08 07:52:46 字数 65 浏览 3 评论 0原文

CUDA SDK中的各种CUDA演示都提到“分散写入”。这些零散的文字是什么？为什么它如此伟大？与此相反的是什么呢？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

自此以后，行同陌路 2024-08-15 07:52:46

我将在这里使用 CUDA 的术语。

分散写入意味着您从每个cuda线程写入任意地址（即，您的warp线程不会写入连续内存，例如）。它与帧缓冲区写入形成对比，帧缓冲区写入是二维一致的，并且可以由硬件合并。直到不久前，这些还是 GPU 唯一可用的写入操作。

它们是收集读取的相反操作，收集读取从分散的位置读取数据，并在对收集的数据以 SIMD 方式执行线程扭曲之前收集所有数据。然而，长期以来，GPU 上都可以通过任意纹理获取来进行收集读取。

回复收藏 0 原文

情深已缘浅 2024-08-15 07:52:46

分散写入很棒，因为它允许您写入任何内存地址。以前的着色器实现通常仅限于给定着色器程序可以写入的内存地址。

“图形 API 中的片段程序仅限于在预先指定的位置输出 32 个浮点数（RGBA * 8 渲染目标），而 CUDA 支持分散写入，即对任何地址进行无限数量的存储。这使得许多新算法成为可能。可以使用图形 API 来使用 CUDA 高效执行”

来自 CUDA 常见问题解答：

http://forums.nvidia.com/index.php?s=fd8a3833d78a50e273c5c731476eed0d&showtopic=84440&pid=478583&start=0&#entry478583

基本上它使CUDA程序更容易编写，因为它们不受可以编写结果的位置的限制。请记住，在 GPU 上获得良好性能的关键之一是利用内存局部性。通过大量写入全局内存来过度使用分散写入很可能会影响您的性能。

回复收藏 0 原文

~没有更多了~

关于作者

执手闯天涯

暂无简介

0 文章

0 评论

22 人气

关注发私信

友情链接

文江博客

CUDA：什么是分散写？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

謌踐踏愛綪

开始看清了

高速公鹿

alipaysp_PLnULTzf66

热情消退

白色月光

友情链接

CUDA：什么是分散写？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

謌踐踏愛綪

开始看清了

高速公鹿

alipaysp_PLnULTzf66

热情消退

白色月光

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。