CUDA：停止所有其他线程

发布于 2024-09-19 20:58:27 字数 508 浏览 8 评论 0原文

我有一个问题，似乎可以通过枚举所有可能的解决方案然后找到最佳解决方案来解决。为此，我设计了一种回溯算法，可以枚举并存储找到的最佳解决方案。到目前为止效果很好。

现在，我想将此算法移植到 CUDA 中。因此，我创建了一个生成一些不同的基本案例的过程。这些基本情况应该在 GPU 上并行处理。如果其中一个 CUDA 线程找到最佳解决方案，那么所有其他线程当然可以停止其工作。

所以，我想要以下内容：找到最佳解决方案的线程应该停止运行我的程序的所有 CUDA 线程，从而完成计算。

经过一些快速搜索，我发现线程只有在同一个块中才能通信。（所以我认为不可能阻止其他线程阻塞。）

我能想到的唯一方法是我有一个专用标志optimum_found，它在每个内核的开头进行检查。如果找到最佳解决方案，则该标志设置为1，因此所有未来线程都知道它们不必工作。但是，当然，如果已经运行的线程不在每次迭代时检查该标志，则它们不会注意到该标志。

那么，是否有可能停止所有剩余的 CUDA 线程？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

〆一缕阳光ご 2024-09-26 20:58:27

我认为你拥有专用标志的方法可以工作，只要它是全局内存中的内存位置。这样您就可以在每次内核调用开始时检查这一点，正如您所说。

无论如何，内核调用通常应该相对较短，因此即使其中一个线程找到了最佳解决方案，让批处理中的其他线程完成也不会对性能产生太大影响。

也就是说，我相当确定没有 CUDA 调用可以杀死其他正在执行的线程。

回复收藏 0 原文

昔梦 2024-09-26 20:58:27

我认为伊恩的想法是正确的。最佳性能来自最少的内存传输和分支。写入全局内存并检查标志（分支）违反了CUDA 最佳实践指南，并且会降低加速速度。

回复收藏 0 原文

如果没结果 2024-09-26 20:58:27

您可能想查看回调。主CPU线程可以确保所有线程按正确的顺序运行。 CPU 回调线程（读：后处理）可以执行额外的开销并调用相关的 api 函数以及处理所有子线程数据...此功能可在 cuda 示例中找到，并在 cuda 功能 2 上进行编译。希望这会有所帮助。

回复收藏 0 原文

~没有更多了~

关于作者

多情出卖

暂无简介

文章

24 人气

关注发私信

友情链接

文江博客

CUDA：停止所有其他线程

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（3）

关于作者

相关话题

热门标签

推荐作者

梦屿孤独相伴

(devoted boy)

qq_pnDqVb

疯到世界奔溃

lock

niuniu

友情链接

CUDA：停止所有其他线程

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（3）

关于作者

相关话题

热门标签

推荐作者

梦屿孤独相伴

(devoted boy)

qq_pnDqVb

疯到世界奔溃

lock

niuniu

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。