使用 GPU 的 CUDA 同时启动多个内核

发布于 2024-09-05 08:04:15 字数 328 浏览 4 评论 0原文

是否可以同时启动两个执行独立任务的内核。例如，如果我有这个 Cuda 代码，

// host and device initialization
.......
.......

// launch kernel1
myMethod1 <<<.... >>> (params);

// launch kernel2
myMethod2 <<<.....>>> (params);

假设这些内核是独立的，是否有一个工具可以同时启动它们，为每个内核分配几个网格/块。 CUDA/OpenCL有这个规定吗？

原文

Is it possible to launch two kernels that do independent tasks, simultaneously. For example if I have this Cuda code

// host and device initialization
.......
.......

// launch kernel1
myMethod1 <<<.... >>> (params);

// launch kernel2
myMethod2 <<<.....>>> (params);

Assuming that these kernels are independent, is there a facility to launch them at the same time allocating few grids/blocks for each. Does CUDA/OpenCL have this provision.

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

我ぃ本無心為│何有愛 2024-09-12 08:04:17

只有具有 CUDA 计算能力 2.0 及更高版本的设备（即 Fermi）才能支持多个并发内核执行。请参阅 CUDA 3.0 编程指南的第 3.2.6.3 节，其中指出：

部分计算能力2.0的设备
可以执行多个内核
同时。应用程序可能会查询
通过调用此功能
cudaGetDeviceProperties() 并检查
concurrentKernels 属性。
内核启动的最大次数
设备可以同时执行
是四。
来自一个 CUDA 上下文的内核不能
与内核同时执行
来自另一个 CUDA 上下文。
使用许多纹理或
大量本地内存较少
可能同时执行
其他内核。