OpenGL 与 OpenCL,选择哪个以及为什么?
哪些功能使 OpenCL 能够独特地选择 OpenGL 和 GLSL 进行计算?尽管有与图形相关的术语和不实用的数据类型,OpenGL 是否有任何真正的警告? 例如,可以…
GPU 代码在从 VS2008 运行时和仅运行 .exe 时给出不同的时间
我的代码中有 cuda 事件来记录执行时间。当我在 VS 2008 中单击“开始调试”时,计时器给出的值为 1.5 秒。但是,当我从 .exe 文件运行该程序时,它给…
OpenCL中重复调用enqueueNDRangeKernel
重复调用 enqueueNDRangeKernel 时还应该调用哪些其他 OpenCL 函数? 我无法找到以这种方式显示 enqueueNDRangeKernel 用法的教程,不幸的是,我的编…
将数据从 CPU 传递到 GPU,而不将其作为参数显式传递
是否可以将数据从 CPU 传递到 GPU 而无需显式将其作为参数传递? 我不想将其作为参数传递,主要是出于语法糖的原因 - 我需要传递大约 20 个常量参数,…
CUDA 上的块间屏障
我想在 CUDA 上实现块间屏障,但遇到了严重的问题。 我不明白为什么它不起作用。 #include #include #include #define SIZE 10000000 #define BLOCKS …
GPGPU编程是否只允许执行SIMD指令?
GPGPU编程是否只允许执行SIMD指令? 如果是这样,那么重写一个具有以下特征的算法一定是一项乏味的任务: 被设计为在通用CPU上运行而在GPU上运行?还…
在 OpenCL 中,mem_fence() 与 Barrier() 相比有何作用?
与barrier()(我想我理解)不同,mem_fence()不会影响工作组中的所有项目。 OpenCL 规范规定(第 6.11.10 节),对于 mem_fence(): 命令加载和存储执…
OpenCL 仅读取/写入 1/4 的缓冲存储器,有时会崩溃
我对 OpenCL 有一个问题,那就是它执行整个命令队列,但它只读取 1/4 的输入,只写入 1/4 的结果。 无论迭代多少次,始终是 1/4。 而且它有时会随机崩…
适用于 GPGPU 的完全开源软件 LAMP 式堆栈?
Closed. This question is seeking recommendations for software libraries, tutorials, tools, books, or other off-site resources. It does not …
如何评估 CUDA GPU 的相对性能?
我怎样才能估计我不拥有的卡的cuda性能,即。新卡? 例如,我发现了一个不完整的 Cuda 示例,作者写道,他在 GF 8600 GT 上花费了 0.7 秒。但在我的 Q…
GPU 的哈希表实现
Closed. This question does not meet Stack Overflow guidelines. It is not currently accepting answers. 要求我们推荐或查找工具、库或最喜欢的…
.Net 中的 GPGPU 编程 - Microsoft Accelerator VS OpenCL.net [VS 其他]
我正在开发一个程序(在.Net中),它有很多图像处理(如2D卷积,...),我想用GPGPU(并行处理)来完成它们 所以,我有一些选择:Microsoft Accelerat…