无法在 CUDA 驱动程序 API 中加载 .cubin 模块
我正在使用 0.3.1 JCuda 和 3.1 nvidia cuda sdk。我正在尝试从 此处 运行 JCudaRuntimeDriverMixSample.java。我使用“nvcc -keep invertVectorElements.cu”编译了 .cu 文件。我将 cuModuleLoad 文件名设置为生成的 .sm_10.cubin 文件。 当我运行编译后的java文件时,我得到CUDA_ERROR_INVALID_SOURCE。我在 GTS 450 GPU 上运行 nvidia 驱动程序版本 256.53。
I am using 0.3.1 JCuda and 3.1 nvidia cuda sdk. I am trying to run JCudaRuntimeDriverMixSample.java from here. I compiled the .cu file with "nvcc -keep invertVectorElements.cu". I set the cuModuleLoad filename to the .sm_10.cubin file generated.
When I run the compiled java file, I get CUDA_ERROR_INVALID_SOURCE. I am running nvidia driver version 256.53 on a GTS 450 gpu.
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
您是否尝试过加载
.ptx
文件而不是.cubin
文件?据我了解,.cubin
文件已经针对非常特定的体系结构进行了组装,而.ptx
是由驱动程序进行 JIT 编译的。 (您仍然可以将 cuModuleLoad 与 .ptx 一起使用)。您正在尝试加载 cubin 的sm_10
版本 - 但您有计算能力 1.0 设备吗?Have you tried loading the
.ptx
file rather than the.cubin
file? As I understand it,.cubin
files are already assembled for very particular architectures, whereas.ptx
are JIT-compiled by the driver. (You can still usecuModuleLoad
with.ptx
). You're attempting to load thesm_10
version of the cubin - but do you have a compute capability 1.0 device?