Cayman 科学计算架构中的本地数据存储与纹理缓存
我正在尝试在 ATI HD 6990 卡(Cayman 架构)上使用 AMD-APP-SDK 2.4 实现 GEMM 实现。 优化技术之一是使用分块/平铺。 在其实现中,如果我们将子矩阵…
Opengl Es如何用于gpgpu实现
我想使用 Opengl Es 进行图像处理代码的 gpgpu 实现。我想知道我可以使用 Opengl Es 来实现此目的吗?如果可以的话,哪个版本的 Opengl Es 将更适合此…
Myers Diff 适合在 GPU 上运行吗?
我有兴趣通过在 GPU(即使用 OpenCL)上运行来实现更快的 Myers diff 实现。我对该算法有很好的了解,但对 GPU 编程还是新手。我的预感是 GPU 的性能…
2D/3D CUDA 块如何划分为扭曲?
如果我从一个块具有尺寸的网格开始我的内核: dim3 block_dims(16,16); 网格块现在如何分割成扭曲?这样一个块的前两行是否形成一个扭曲,或者前两列…
我什么时候可以发布源 PBO?
我正在使用 PBO 在 CPU 和 GPU 之间异步移动数据。 当从 GPU 移动时,我知道在 PBO 上调用 glMapBuffer 后可以删除源纹理。 然而,反过来又如何呢?我…
Boost::thread() 和 Nvidia CUDA 是否存在某种不兼容性?
我正在开发一个通用的流式 CUDA 内核执行框架,它允许并行数据复制和复制。在 GPU 上执行。 目前,我正在 C++ 静态函数包装器中调用 cuda 内核,因此…
有 CUDA 的 Lisp 扩展吗?
我刚刚注意到,WD Hillis 连接机的首批语言之一是 *Lisp,它是具有并行结构的 Common Lisp 的扩展。连接机是一台具有 SIMD 架构的大规模并行计算机,…
做工作而不是等待 glMapBuffer
我正在使用 OpenGL 进行一些 GPGPU 处理。所以我有不同的线程为 OpenGL 处理线程提供工作。 在每个“工作项”之后,我需要调用 glReadPixels 和 glMap…
编译 Cuda 时出错 - 预期的主要表达式
这个程序看起来不错,但我仍然收到错误,有什么建议吗? 程序: #include "dot.h" #include #include #include int main(int argc, char** argv) { in…
PyCUDA+Threading = 内核调用的无效句柄
我会尽力澄清这一点; 我有两节课; GPU(Object),用于对 GPU 功能的一般访问;multifunc(threading.Thread) 用于我尝试多设备化的特定功能。 GPU 包…
在 GPU 编程中使用条件时,工作项会执行什么?
如果您有工作项在波前执行,并且有一个条件,例如: if(x){ ... } else{ .... } 工作项执行什么?波前中的所有工作项都将执行第一个分支(即 x == tru…