如何获取要执行的 PTX 文件
我知道如何从 .cu
生成 .ptx
文件以及如何从 .ptx 生成
但我不知道如何获得最终的可执行文件。.cubin
文件。
更具体地说,我有一个 sample.cu
文件,它被编译为 sample.ptx
。然后,我使用 nvcc 将 sample.ptx
编译为 sample.cubin
。然而,这个.cubin
文件在没有主机代码的情况下无法直接执行。如何将 .cubin
文件链接到我的原始 .cu
文件以生成最终的可执行文件?
I know how to generate a .ptx
file from a .cu
and how to generate a .cubin
file from a .ptx.
But I don't know how to get the final executable.
More specifically, I have a sample.cu
file, which is compiled to sample.ptx
. I then use nvcc to compile sample.ptx
to sample.cubin
. However, this .cubin
file cannot be directly executed without host code. How can I link .cubin
file to my original .cu
file to produce the final executable?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(2)
您应该能够使用 cuModuleLoadDataEx 直接从 cuda 驱动程序 api 运行 ptx 代码。 此处第 5 页有一个示例
You should be able to run ptx code directly from the cuda driver api with cuModuleLoadDataEx. There is an example here at page 5
从 CUDA 4.0 开始,您可以在 CUDA 内核中编写内联 PTX。
As of CUDA 4.0, you can write inline PTX in CUDA kernels.