用short替换int对CUDA的性能有帮助吗
假设我们有足够的全局内存。用 short 替换 int 是否可以提高 CUDA 的性能? (如short节省了共享内存、寄存器等的使用) 欢迎建议。谢谢。…
编译 helloworld.cu 时遇到问题
在 Ubuntu 10.10 中编译这个 hello world 示例时, 这来自 CUDA 示例,章节3(没有提供编译指令>:@) #include __global__ void kernel (void){ } in…
WPF 应用程序中的 CUDA 和 Direct3D 互操作性
我尝试使用CUDA计算和Direct3D 9图形来实现WPF应用程序。所以我使用以下方法: 我使用 MSDN“演练:托管 Direct3D9”创建 WPF 应用程序 WPF 中的内容…
cuda nbody模拟-共享内存问题
基于 Nvidia GPU 计算 SDK 的示例,我为 nbody 模拟创建了两个内核。第一个不利用共享内存的内核比第二个使用共享内存的内核快约 15%。为什么共享内存…
如何告诉 NVCC 生成 x64 obj?
我在使用 VS 2006 CUDA 4.0 x64 编译为 x64 时遇到问题。 NVCC 编译器生成 32 位 obj 文件,然后 MS 链接器抱怨该 obj 文件不是针对 x64 的。有没有办…
对 2D 数组使用纹理缓存/Image2D 的缺点?
当访问全局内存中的 2D 数组时,使用纹理缓存有很多好处,例如过滤并且不必太关心内存访问模式。 CUDA 编程指南仅指出了一个缺点: 但是,在同一…
编译cuda代码时遇到问题
我想编译这个体积渲染项目。我在 Ubuntu 10.10 计算机上安装了 CUDA 工具包和 SDK,并且能够运行其示例,但我得到了这个: antonio@antonio-desktop:~…
可以用整数索引 CUDA 纹理吗
正如题目所说。可以使用整数坐标访问 CUDA 纹理吗? 前任。 tex2D(myTex, 1, 1); 我想在纹理中存储浮点值,并将其用作我的帧缓冲区。 我会将其传递给 …
Visual Studio 2010 CUDA 4.0 链接器错误
有谁知道一种简单的方法来修复以下错误: 1>matrixmul.cu.obj : error LNK2019: unresolved external symbol __imp_cutComparefe referenced in funct…