编程 cuda 内核时整数的大小是多少
我似乎无法在 Cuda 编程指南中找到这个简单问题的答案:When compiling a kernel with nvcc, What size integer is statements byshort, int, long, a…
如何创建 CUDA dll?
我需要在我的应用程序中使用 cuda。但我无法创建 dll。这里有一些代码。 __global__ void calc(float *a, int n) { int idx = blockIdx.x * blockDim.…
CUDA 上的并行归约和查找索引
我有一个 20K 值的数组,我将其减少为 50 个块,每个块有 400 个线程。 num_blocks = 50 和 block_size = 400。 我的代码如下所示: getmax <<<…
如何使用 Mipmapping 将 CUDA 生成的 PBO 复制到纹理
我正在尝试将 PBO 复制到启用了自动 mipmapping 的纹理中,但似乎只生成了顶级纹理(换句话说,没有发生 mipmapping)。 我正在构建一个 PBO //Genera…
CUDA常量内存无效符号
struct d_struct { // stuff } __device__ __constant__ d_struct structs[SIZE] 当我调用 cudaMemcpyToSymbol("structs", &h_struct, sizeof(d_st…
如何成功读取 2D 纹理
我如何: 将 cudaMallocPitch 浮点内存绑定到 2D 纹理引用 将一些主机数据复制到设备上的 2D 数组 将 1 添加到纹理引用并写入 a.) Pitch 2D 数组或 b.…
计算教授的非相干和相干 gst/gld 场? (CUDA/OpenCL)
我正在使用 Compute Prof 3.2 和 Geforce GTX 280。我相信我的计算能力为 1.3。 此文件,似乎表明我应该能够看到这些字段,因为我使用的是 1.x 计算设…
为什么 Cuda/OpenCL 的全局内存中不存在库冲突?
我还没有弄清楚并且谷歌没有帮助我的一件事是,为什么有可能与共享内存发生银行冲突,但在全局内存中却没有?银行与寄存器会存在冲突吗? 更新 哇,我…
无法在 CUDA 驱动程序 API 中加载 .cubin 模块
我正在使用 0.3.1 JCuda 和 3.1 nvidia cuda sdk。我正在尝试从 此处 运行 JCudaRuntimeDriverMixSample.java。我使用“nvcc -keep invertVectorEleme…
无法使用 Xcode 构建简单的 Cuda 程序!
我在 Mac OS 10.6 上使用 Xcode 3.2 为 CUDA 构建一个非常简单的 HelloWorld 程序 但它无法建立..任何想法! 这是代码: #include <iostream> #in…