关于计算视觉分析器和用于分析的块数
在《Compute Visual Profiler 用户指南》第 51 页上,它指出: 请注意,如果数字 内核中的块小于或不是多处理器数量的倍数 多次运行的计数器值将不一…
CUDA 计数、减少和线程扭曲
我正在尝试创建一个 cuda 程序,通过缩减算法来计算长向量中的真值(由非零值定义)的数量。我得到了有趣的结果。我得到 0 或 (ceil(N/threadsPerBloc…
编程 cuda 内核时整数的大小是多少
我似乎无法在 Cuda 编程指南中找到这个简单问题的答案:When compiling a kernel with nvcc, What size integer is statements byshort, int, long, a…
如何创建 CUDA dll?
我需要在我的应用程序中使用 cuda。但我无法创建 dll。这里有一些代码。 __global__ void calc(float *a, int n) { int idx = blockIdx.x * blockDim.…
CUDA 上的并行归约和查找索引
我有一个 20K 值的数组,我将其减少为 50 个块,每个块有 400 个线程。 num_blocks = 50 和 block_size = 400。 我的代码如下所示: getmax <<<…
如何使用 Mipmapping 将 CUDA 生成的 PBO 复制到纹理
我正在尝试将 PBO 复制到启用了自动 mipmapping 的纹理中,但似乎只生成了顶级纹理(换句话说,没有发生 mipmapping)。 我正在构建一个 PBO //Genera…
CUDA常量内存无效符号
struct d_struct { // stuff } __device__ __constant__ d_struct structs[SIZE] 当我调用 cudaMemcpyToSymbol("structs", &h_struct, sizeof(d_st…
如何成功读取 2D 纹理
我如何: 将 cudaMallocPitch 浮点内存绑定到 2D 纹理引用 将一些主机数据复制到设备上的 2D 数组 将 1 添加到纹理引用并写入 a.) Pitch 2D 数组或 b.…
计算教授的非相干和相干 gst/gld 场? (CUDA/OpenCL)
我正在使用 Compute Prof 3.2 和 Geforce GTX 280。我相信我的计算能力为 1.3。 此文件,似乎表明我应该能够看到这些字段,因为我使用的是 1.x 计算设…