nvcc(CUDA)中的增量编译

发布于 2024-08-23 08:56:33 字数 409 浏览 7 评论 0原文

我有许多结构(类)和独立函数,我喜欢单独编译,然后链接到 CUDA 内核,但在编译(不链接)内核时收到 External Calls are not support 错误。 nvcc 强制始终使用内核中的内联函数。这非常令人沮丧!如果有人找到了实现增量编译的方法,请分享。

另请参阅 NVIDIA 论坛上的以下主题。 http://forums.nvidia。 com/index.php?s=&showtopic=103256&view=findpost&p=1009242

I have many structs (classes) and standalone functions that I like to compile separately and then link to the CUDA kernel, but I am getting the External calls are not supported error while compiling (not linking) the kernel. nvcc forces to always use inline functions from the kernel. This is very frustrating!! If somebody have figured out a way to achieve incremental compilation, please share.

Also see the following thread on NVIDIA forums.
http://forums.nvidia.com/index.php?s=&showtopic=103256&view=findpost&p=1009242

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(2

对不⑦ 2024-08-30 08:56:33

目前,您无法从 CUDA 中的 GPU 调用设备函数,这就是它们被内联的原因。

Fermi 硬件支持无需内联的设备功能。

Currently you cannot call device functions from the GPU in CUDA, which is why they are inlined.

Fermi hardware supports device functions without inlining.

醉殇 2024-08-30 08:56:33

好的,现在可以用 CUDA 5 来完成。

Ok, it can now be done with CUDA 5.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文