CPU和GPU之间的指令传输

发布于 2025-01-06 07:23:14 字数 227 浏览 2 评论 0原文

我正在寻找有关在使用 GPGPU 计算时 CPU 如何将程序代码移动到 GPU 的信息。互联网上有很多关于数据传输的手册，但没有关于指令/程序加载的手册。

问题是：程序由 CPU 处理，CPU 在每个计算单元上使用足够的标志“配置”GPU 来执行给定的操作。之后，数据被传输和处理。第一次手术是如何进行的？指令是如何下发给GPU的？这些指令是否以某种方式打包以利用总线带宽？我可能忽略了一些基本的东西，所以欢迎任何其他信息。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

-柠檬树下少年和吉他 2025-01-13 07:23:14

关于它的信息确实不多，但你高估了效果。

整个内核代码仅加载到 GPU 上一次（最坏的情况是每个内核调用一次，但看起来实际上每个应用程序运行一次，见下文），然后完全在 GPU 上执行，无需任何操作。 CPU 的干预。因此，在内核调用之前，整个内核代码会被复制到一个块中。估算一下代码大小，我们自制的MD包的所有GPU代码（52个内核，其中一些>150行代码）的.cubin大小只有91 KiB，所以是安全的假设在几乎所有情况下，代码传输时间都可以忽略不计。

以下是我在官方文档中找到的信息：

在 CUDA 驱动程序 API，代码会在您调用 cuModuleLoad 函数