当前位置：文江博客话题详情

Nvidia CUDA 中的预取

发布于 2024-12-10 17:34:49 字数 129 浏览 5 评论 0原文

我正在 nVidia CUDA 中进行数据预取。我阅读了一些有关设备本身预取的文档，即从共享内存预取到缓存。

但我对 CPU 和 GPU 之间的数据预取感兴趣。任何人都可以给我提供一些有关此事的文件或信息吗？任何帮助将不胜感激。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

谈场末日恋爱 2024-12-17 17:34:49

根据您的评论回答：

当我们想要对大数据执行计算时，理想情况下我们会将最大数据发送到 GPU，执行计算，将其发送回 CPU，即发送、计算、发送（返回到 CPU），现在当它发送回 CPU GPU 时拖延，现在我的计划是给CU程序，假设它在整个全局内存中运行，我将迫使它在全局内存的一半中运行，以便剩下的一半我可以用于数据预取，所以虽然计算是正在表演在一半中同时我在另一半中预取数据。所以不会有任何停顿。现在告诉我这样做是否可行？性能会降低还是升级？应该增强..

引入 CUDA 流来准确启用这种方法。

如果您的计算相当密集，那么是的——它可以大大提高您的性能。另一方面，如果数据传输占用了您 90% 的时间，您将仅节省计算时间 - 也就是说 - 最多 10%...

有关如何使用流的详细信息（包括示例）在 CUDA 中提供编程指南。
对于 4.0 版本，这将是“3.2.5.5 Streams”部分，特别是“3.2.5.5.5 Overlapping Behaviour”——在那里，他们在内核仍在运行时启动另一个异步内存副本。

回复收藏 0 原文