OpenCL 图像直方图
我正在尝试在 OpenCL 中编写直方图内核来计算 RGBA32F 输入图像的 256 bin R、G 和 B 直方图。我的内核看起来像这样: const sampler_t mSampler = CL…
OpenCL getDeviceInfo:如何获取有关 CPU 内内核的信息?
通过 OpenCL 的 getDeviceInfo,我们可以获得可用计算单元的数量 (CL_DEVICE_MAX_COMPUTE_UNITS)。在我的 nVidia Geforce 8600GTS 上,我有 4 个计算…
OpenCL 写入缓冲区选择
可能的重复: 两种创建缓冲区对象的方法opencl:clCreateBuffer 与 clCreateBuffer + clEnqueueWriteBuffer 在缓冲区创建后立即将数据复制到设备与稍…
pycuda.debug 实际上做了什么?
作为一个更大项目的一部分,我遇到了一个奇怪的一致错误,我无法理解它,但它是一个典型的“黑匣子”错误;当使用 cuda-gdb python -m pycuda.debug p…
PyCUDA:查询设备状态(特别是内存)
PyCUDA 的文档顺便提到了 驱动程序接口 调用,但我有点思考并且可以'我不知道如何从我的代码中获取诸如“SHARED_SIZE_BYTES”之类的信息。 谁能向我指…
CUDA:不支持未对齐的内存访问:我错过了什么?
有一些问题类似对此,但在这种情况下,它有点奇怪; NVCC 3.1 不喜欢这样,但 3.2 和 4.0RC 喜欢; float xtmp[MAT1]; for (i=0; i
CUDA 卡偶尔会因运行中“启动失败”而崩溃,以及 Snow
我想拍一张屏幕上发生的情况的照片,但屏幕截图无法捕获它,但最好的描述是雪。 我的一个项目有一个习惯,就是在新的迭代中随机失败,我总是认为这是…
GTS 250 和 Fermi 器件之间的 CUDA 块同步差异
所以我一直在研究一个在全局内存中创建哈希表的程序。该代码在 GTS250(Compute 1.1 设备)上完全可用(尽管速度较慢)。但是,在 Compute 2.0 设备(…
有关数据并行编程和算法的好书籍和资源
Closed. This question is seeking recommendations for software libraries, tutorials, tools, books, or other off-site resources. It does not …