cudaGraphicsGLRegisterImage 之后释放 CUDA 中的内存而不破坏缓冲区
我正在开发一个项目,该项目结合使用 OpenGL 绘图技术和 CUDA 来执行分析。我想使用 CUDA 生成渲染缓冲区,然后使用 OpenGL 对其进行分析。由于缓冲区…
Boost::thread() 和 Nvidia CUDA 是否存在某种不兼容性?
我正在开发一个通用的流式 CUDA 内核执行框架,它允许并行数据复制和复制。在 GPU 上执行。 目前,我正在 C++ 静态函数包装器中调用 cuda 内核,因此…
是“2D fft”与两个一维 fft 相同吗?
我有一个 cuda 代码,我在其中实现了多个 C2C 2D FFT。它们都使用相同的计划,但由于某种原因,2D FFT 的时间很大,并且似乎差异很大。相同数据大小的…
有 CUDA 的 Lisp 扩展吗?
我刚刚注意到,WD Hillis 连接机的首批语言之一是 *Lisp,它是具有并行结构的 Common Lisp 的扩展。连接机是一台具有 SIMD 架构的大规模并行计算机,…
CUDA:访问两个维度的任意长矩阵
嘿, 目前我正在使用仅在一维索引的线程来访问矩阵的所有元素,如下所示: // Thread-ID int idx = blockIdx.x * blockDim.x + threadIdx.x // Offset…
是否可以在应用程序之间共享 Cuda 上下文?
我想在两个独立的 Linux 进程之间传递 Cuda 上下文(使用我已经设置的 POSIX 消息队列)。 使用 cuCtxPopCurrent() 和 cuCtxPushCurrent() ,我可以获…
Cuda 用 2D 块替换 double
我对 CUDA 很陌生,一直在尝试遍历 2D 数组。我有以下代码,可以在普通 C 上按预期工作: for (ty=0ty<sty++){ if (ty+pixY < s && ty+pixY…
优化有关寄存器的 CUDA 内核
我正在使用 CUDA 占用计算器来尝试优化我的 CUDA 内核。目前我使用 34 个寄存器和零共享内存...因此,每块 310 个线程的最大占用率为 63%。当我可以以…
寄存器和共享内存取决于编译计算能力?
当我使用 nvcc -arch=sm_13 编译时,我得到: ptxas info : Used 29 registers, 28+16 bytes smem, 7200 bytes cmem[0], 8 bytes cmem[1] 当我使用 nv…
我在哪里可以找到“Cuda/PyCuda for Dummies”教程
Closed. This question does not meet Stack Overflow guidelines. It is not currently accepting answers. 要求我们推荐或查找工具、库或最喜欢的…