CUDA:使用 -deviceemu 和 gdb 进行调试

发布于 2024-09-28 21:24:35 字数 1299 浏览 2 评论 0原文

我编写了一个 CUDA 应用程序,其中包含一些硬编码参数(通过#define)。一切似乎都正常,所以我尝试了一些其他参数。现在,该程序不再正常工作。

所以,我想调试一下。我使用 -deviceemu -g -O0 选项编译应用程序,因为我读到可以使用 gdb 来调试它。在 gdb 中,我使用 break kernelstart 在内核启动处设置了一个断点。

然而,gdb 在我的 CUDA 内核的开头跳转,但我无法单步执行它,因为它不允许我检查内核内的内容。我认为最好给出 gdb 的输出:

Breakpoint 1, kernelstart (__cuda_0=0x100000, __cuda_1=0x101000, __cuda_2=0x102000, __cuda_3=0x102100) at cudatest.cu:287
(gdb) s
__device_stub__Z12kernelstartPjS_S_S_ (__par0=0x100000, __par1=0x101000, __par2=0x102000, __par3=0x102100) at /tmp/tmpxft_000003c4_00000000-1_cudatest.cudafe1.stub.c:7
7   /tmp/tmpxft_000003c4_00000000-1_cudatest.cudafe1.stub.c: No such file or directory.
    in /tmp/tmpxft_000003c4_00000000-1_cudatest.cudafe1.stub.c
(gdb) s
cudaLaunch<char> (entry=0x804a98d "U\211\345\203\354\030\213E\024\211D$\f\213E\020\211D$\b\213E\f\211D$\004\213E\b\211\004$\350\r\377\377\377\311\303U\211\345\203\354\070\307\004$\340 \005\b\350\345\341\377\377\243P!\005\b\307\004$x\234\004\b\350\b\001") at /usr/local/cuda/bin/../include/cuda_runtime.h:773
(gdb) s
(gdb) s
cudatest (__cuda_0=0x100000, __cuda_1=0x101000, __cuda_2=0x102000, __cuda_3=0x102100) at cudatest.cu:354
(gdb) s

之后,它跳回到我的 main 过程。

我知道我的规格非常模糊,但有人能猜出问题出在哪里吗?是否可以使用 gdb 检查内核?

I wrote a CUDA application that has some hardcoded parameters in it (via #defines). Everything seemed to work right, so I tried some other parameters. Now, the program doesn't work correctly anymore.

So, I want to debug it. I compile the application with -deviceemu -g -O0 options, because I read that I can then use gdb to debug it. In gdb, I set a breakpoint at the kernel start using break kernelstart.

However, gdb, jumps at the start of my CUDA kernel, but I can not step through it, because it doesn't let me inspect things within the kernel. I think it's best if I give the output of gdb:

Breakpoint 1, kernelstart (__cuda_0=0x100000, __cuda_1=0x101000, __cuda_2=0x102000, __cuda_3=0x102100) at cudatest.cu:287
(gdb) s
__device_stub__Z12kernelstartPjS_S_S_ (__par0=0x100000, __par1=0x101000, __par2=0x102000, __par3=0x102100) at /tmp/tmpxft_000003c4_00000000-1_cudatest.cudafe1.stub.c:7
7   /tmp/tmpxft_000003c4_00000000-1_cudatest.cudafe1.stub.c: No such file or directory.
    in /tmp/tmpxft_000003c4_00000000-1_cudatest.cudafe1.stub.c
(gdb) s
cudaLaunch<char> (entry=0x804a98d "U\211\345\203\354\030\213E\024\211D$\f\213E\020\211D$\b\213E\f\211D$\004\213E\b\211\004$\350\r\377\377\377\311\303U\211\345\203\354\070\307\004$\340 \005\b\350\345\341\377\377\243P!\005\b\307\004$x\234\004\b\350\b\001") at /usr/local/cuda/bin/../include/cuda_runtime.h:773
(gdb) s
(gdb) s
cudatest (__cuda_0=0x100000, __cuda_1=0x101000, __cuda_2=0x102000, __cuda_3=0x102100) at cudatest.cu:354
(gdb) s

After, this, it jumps back to my main procedure.

I know that my specifications are more than vague, but can anybody guess where the problem is? Is it possible to inspect kernels using gdb?

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(2

清风无影 2024-10-05 21:24:35
  1. 使用 cuda-gdb
  2. 编译: nvcc -g -G filename.cu
  3. 在 a.out 上调用 cuda-gdb
  4. 您可以像往常一样在内核函数中设置断点。
  5. 运行该程序,它应该停止在内核函数内。
  6. 您甚至可以使用 cuda thread 等命令获取正在执行的当前线程的详细信息。还存在其他命令,例如 cuda block。
  7. 要在线程之间切换,请输入 cuda thread (x,y,z)

有关更多详细信息,请参阅最新版本的 cuda-gdb 文档。如果您使用的是最新版本的 cuda 工具包(即今天的 3.2),请确保您正在查看最新版本的文档(因为选项已发生很大变化)。

并且还要确保您正在从控制台(X11 外部)运行 cuda-gdb,因为您将停止 GPU 进行调试。

希望这有帮助。

  1. Use cuda-gdb
  2. Compile: nvcc -g -G filename.cu
  3. Invoke cuda-gdb on your a.out
  4. You can set breakpoint inside your kernel function as usual.
  5. Run the program, and it should stop inside your kernel function.
  6. You can even get details of the current thread which is being executed using commands like cuda thread. Other commands like cuda block exist.
  7. To switch between threads say cuda thread (x,y,z)

For more details refer to the latest version of cuda-gdb's documentation. If you are using the latest version of cuda toolkit (ie, 3.2 as of today), make sure you are looking at the latest version of the documentation (as the options have changed a lot).

And also make sure you are running cuda-gdb from a console (outside X11), since you are stopping your GPU for debugging.

Hope this helps.

偏爱自由 2024-10-05 21:24:35

编译:

nvcc -g -G --keep

为我解决了这个问题。这可确保编译期间生成的所有中间文件不会被删除,以便调试器可以找到它们。

Compiling with :

nvcc -g -G --keep

fixed this problem for me. This ensures all the intermediate files generated during compilation are not erased so that the debugger can find them.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文