如何诊断由于资源不足而导致 CUDA 启动失败？

发布于 2024-11-27 17:31:19 字数 551 浏览 3 评论 0原文

我在尝试启动 CUDA 内核（通过 PyCUDA）时遇到资源不足错误，我想知道是否可以让系统告诉我缺少哪个资源。显然系统知道什么资源已经耗尽，我也只想查询一下。

我已经使用了占用率计算器，一切看起来都很好，所以要么有一个极端的情况没有被涵盖，要么我使用错误。我知道这不是寄存器（这似乎是通常的罪魁祸首），因为我使用的是 <= 63，并且在 CC 2.1 设备上使用 1x1x1 块和 1x1 网格时它仍然失败。

感谢您的任何帮助。我在 NVidia 板上发布了一个帖子：

http://forums.nvidia。 com/index.php?showtopic=206261&st=0

但没有得到回应。如果答案是“你不能向系统询问该信息”，那么也很高兴知道（有点......；）。

编辑：

我见过的最多寄存器使用次数是 63。编辑上面的内容以反映这一点。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

清君侧 2024-12-04 17:31:19

我认为 PyCUDA 使用 CUDA 驱动程序 API，因此以下可能是错误的：如果您在使用 cuLaunch() 时没有指定足够的参数，或者指定了错误的参数大小，则可能会发生 CUDA_ERROR_LAUNCH_OUT_OF_RESOURCES 。启动内核。由于您使用的是 PyCUDA，因此内核所需的参数列表与您实际传递的参数可能很容易不匹配，因此您可能需要检查如何调用内核。

我认为在这种情况下这是一个命名不当的错误代码......

回复收藏 0 原文