有 CUDA 的 Lisp 扩展吗?
我刚刚注意到,WD Hillis 连接机的首批语言之一是 *Lisp,它是具有并行结构的 Common Lisp 的扩展。连接机是一台具有 SIMD 架构的大规模并行计算机,…
做工作而不是等待 glMapBuffer
我正在使用 OpenGL 进行一些 GPGPU 处理。所以我有不同的线程为 OpenGL 处理线程提供工作。 在每个“工作项”之后,我需要调用 glReadPixels 和 glMap…
编译 Cuda 时出错 - 预期的主要表达式
这个程序看起来不错,但我仍然收到错误,有什么建议吗? 程序: #include "dot.h" #include #include #include int main(int argc, char** argv) { in…
PyCUDA+Threading = 内核调用的无效句柄
我会尽力澄清这一点; 我有两节课; GPU(Object),用于对 GPU 功能的一般访问;multifunc(threading.Thread) 用于我尝试多设备化的特定功能。 GPU 包…
在 GPU 编程中使用条件时,工作项会执行什么?
如果您有工作项在波前执行,并且有一个条件,例如: if(x){ ... } else{ .... } 工作项执行什么?波前中的所有工作项都将执行第一个分支(即 x == tru…
OpenCL 图像直方图
我正在尝试在 OpenCL 中编写直方图内核来计算 RGBA32F 输入图像的 256 bin R、G 和 B 直方图。我的内核看起来像这样: const sampler_t mSampler = CL…
OpenCL getDeviceInfo:如何获取有关 CPU 内内核的信息?
通过 OpenCL 的 getDeviceInfo,我们可以获得可用计算单元的数量 (CL_DEVICE_MAX_COMPUTE_UNITS)。在我的 nVidia Geforce 8600GTS 上,我有 4 个计算…
OpenCL 写入缓冲区选择
可能的重复: 两种创建缓冲区对象的方法opencl:clCreateBuffer 与 clCreateBuffer + clEnqueueWriteBuffer 在缓冲区创建后立即将数据复制到设备与稍…
pycuda.debug 实际上做了什么?
作为一个更大项目的一部分,我遇到了一个奇怪的一致错误,我无法理解它,但它是一个典型的“黑匣子”错误;当使用 cuda-gdb python -m pycuda.debug p…
PyCUDA:查询设备状态(特别是内存)
PyCUDA 的文档顺便提到了 驱动程序接口 调用,但我有点思考并且可以'我不知道如何从我的代码中获取诸如“SHARED_SIZE_BYTES”之类的信息。 谁能向我指…
CUDA:不支持未对齐的内存访问:我错过了什么?
有一些问题类似对此,但在这种情况下,它有点奇怪; NVCC 3.1 不喜欢这样,但 3.2 和 4.0RC 喜欢; float xtmp[MAT1]; for (i=0; i
CUDA 卡偶尔会因运行中“启动失败”而崩溃,以及 Snow
我想拍一张屏幕上发生的情况的照片,但屏幕截图无法捕获它,但最好的描述是雪。 我的一个项目有一个习惯,就是在新的迭代中随机失败,我总是认为这是…