nvcc(CUDA)中的增量编译
我有许多结构(类)和独立函数,我喜欢单独编译,然后链接到 CUDA 内核,但在编译(不链接)内核时收到 External Calls are not support
错误。 nvcc 强制始终使用内核中的内联函数。这非常令人沮丧!如果有人找到了实现增量编译的方法,请分享。
另请参阅 NVIDIA 论坛上的以下主题。 http://forums.nvidia。 com/index.php?s=&showtopic=103256&view=findpost&p=1009242
I have many structs (classes) and standalone functions that I like to compile separately and then link to the CUDA kernel, but I am getting the External calls are not supported
error while compiling (not linking) the kernel. nvcc forces to always use inline functions from the kernel. This is very frustrating!! If somebody have figured out a way to achieve incremental compilation, please share.
Also see the following thread on NVIDIA forums.
http://forums.nvidia.com/index.php?s=&showtopic=103256&view=findpost&p=1009242
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(2)
目前,您无法从 CUDA 中的 GPU 调用设备函数,这就是它们被内联的原因。
Fermi 硬件支持无需内联的设备功能。
Currently you cannot call device functions from the GPU in CUDA, which is why they are inlined.
Fermi hardware supports device functions without inlining.
好的,现在可以用 CUDA 5 来完成。
Ok, it can now be done with CUDA 5.