cuda内核中的函数
有什么方法可以在 cuda 内核中拥有一个函数吗?我的意思是我的 cuda 内核变得相当长并且在某一时刻很难调试。谢谢。
Is there any ways i can have a function inside cuda kernel. I mean my cuda kernel gets pretty long and hard to debug at one point. Thanks.
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
是的,只需用
__device__
标记函数,它就只能从 GPU 调用。查看 CUDA 编程指南,B.1 节这是直接链接
yes, just mark function with
__device__
and it will be callable only from GPU. Check CUDA Programming guide, section B.1Here is the direct link