当前位置：文江博客话题详情

CUDA/PyCUDA：诊断在 cuda-gdb 下消失的启动失败

发布于 2024-11-02 10:21:37 字数 118 浏览 4 评论 0原文

有人知道在 cuda-gdb 下运行时消失的内核启动失败的可能调查途径吗？内存分配符合规范，每次在同一内核的同一运行中启动都会失败，并且（到目前为止）它在调试器中尚未失败。

噢，太棒了，大师们，现在怎么办？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

热风软妹 2024-11-09 10:21:38

CUDA GDB可以使一些cuda操作同步。

您是否在初始化后从内存中读取数据？
你在使用 Streams 吗？
您是否启动了多个内核？
它在哪里以及如何失败？

回复收藏 0 原文

苦妄 2024-11-09 10:21:37

cuda-gdb 将所有共享内存和寄存器溢出到本地内存。因此，当为调试而构建的某些东西运行正常但否则失败时，通常意味着共享内存访问越界。 cuda-memcheck 可能会有所帮助，具体取决于您使用的卡类型。费米在这方面比旧卡更好。

编辑：
让我回想起过去糟糕的日子，我记得有一个脾气暴躁的 GT9500，它过去常常抛出类似的 NV13 错误，并且在运行具有大量共享内存活动的内存密集型内核时出现随机代码故障。调试时从来没有。我将其归咎于硬件故障，然后转而使用 GT200，此后再也没有出现过类似的错误。一种可能性可能是硬件不良。这是 G92（9800GT 或类似产品）吗？

回复收藏 0 原文

~没有更多了~