CUDA:标识符“cudaMemGetInfo”未定义
为了估计程序在一次内核启动中可以处理多少数据,我尝试使用 cudaMemGetInfo() 获取一些内存信息。然而,编译器告诉我: 错误:标识符“cudaMemGetInf…
在 Lion 上编译 CUDA SDK 失败
我收到以下错误: /usr/include/libkern/i386/_OSByteOrder.h(60): error: identifier "__builtin_bswap32" is undefined /usr/include/libkern/i386/…
cuda内核不改变输入数组
我的 CUDA 内核似乎没有更改我传入的数组的值,这是相关的主机代码: dim3 grid(numNets, N); dim3 threads(1, 1, 1); // allocate the arrays and ja…
用short替换int对CUDA的性能有帮助吗
假设我们有足够的全局内存。用 short 替换 int 是否可以提高 CUDA 的性能? (如short节省了共享内存、寄存器等的使用) 欢迎建议。谢谢。…
编译 helloworld.cu 时遇到问题
在 Ubuntu 10.10 中编译这个 hello world 示例时, 这来自 CUDA 示例,章节3(没有提供编译指令>:@) #include __global__ void kernel (void){ } in…
WPF 应用程序中的 CUDA 和 Direct3D 互操作性
我尝试使用CUDA计算和Direct3D 9图形来实现WPF应用程序。所以我使用以下方法: 我使用 MSDN“演练:托管 Direct3D9”创建 WPF 应用程序 WPF 中的内容…
cuda nbody模拟-共享内存问题
基于 Nvidia GPU 计算 SDK 的示例,我为 nbody 模拟创建了两个内核。第一个不利用共享内存的内核比第二个使用共享内存的内核快约 15%。为什么共享内存…
如何告诉 NVCC 生成 x64 obj?
我在使用 VS 2006 CUDA 4.0 x64 编译为 x64 时遇到问题。 NVCC 编译器生成 32 位 obj 文件,然后 MS 链接器抱怨该 obj 文件不是针对 x64 的。有没有办…