如何在Android上使用OpenCL?
对于平台独立性(桌面、云、移动……),当速度很重要时,使用 OpenCL 进行 GPGPU 开发会很棒。我知道 Google 正在推动 RenderScript 作为替代方案,…
GL-CL-Interop:纹理完整性测试
编辑:按照建议,我将纹理目标更改为GL_TEXTURE_2D。所以初始化现在看起来像这样: void initTexture( int width, int height ) { glGenTextures(1, &…
JOCL:为什么使用缓冲区?
给定一个 float[n] inputdata 传递给 OpenCL 内核,任何人都可以启发我了解以下三种将其传递给内核的方法之间的区别: A) cl_mem input = clCreateBuf…
处理 OpenCL 粒子系统中浮点精度不足的问题
我正在编写一个基于 OpenCL 的粒子系统,以加快大规模网络的可视化速度。本质上,这是一个两阶段问题,其中第一阶段对每个粒子施加负重力(典型的 n …
OpenCL 内核在更快的 GPU 上执行速度更慢
我对 OpenCL 相当陌生,一直在尝试实现 DSP 算法 比较其在不同 GPU 上的性能与标准 CPU 实现的性能。 虽然我已经实现了巨大的性能提升,但我发现奇怪…
OpenCL AMD 与 NVIDIA 性能对比
我实现了一个简单的内核,它是某种卷积。我在NVIDIA GT 240上进行了测量。在CUDA上编写时需要70毫秒,在OpenCL上编写时需要100毫秒。好吧,我想,NVID…
有一个不错的 OpenCL 入门套件吗?
Closed. This question is off-topic. It is not currently accepting answers. 想要改进此问题吗?更新问题,使其关于- Stack Overflow 的主题。 11…
clGetPlatformIDs 返回两个平台,但它们是相同的
要创建 opencl 应用程序,第一步是通过使用获取平台 clGetPlatformIDs 我对从函数返回的平台有问题;函数返回我有 2 个平台,但当我检查它们时,我发…
OpenCL 标量与矢量
我有简单的内核: __kernel vecadd(__global const float *A, __global const float *B, __global float *C) { int idx = get_global_id(0); C[idx] =…
指针算术错误 (OpenCL)
有人可以解释一下为什么这段代码不起作用吗? __kernel void foo(__global const void* a) { __global const uchar* currentPosition = (__global uch…
如何在 OpenCL 中声明本地内存?
我正在运行下面的 OpenCL 内核,二维全局工作大小为 1000000 x 100,本地工作大小为 1 x 100。 __kernel void myKernel( const int length, const int…
需要有关 GPGPU 库的建议
我正在编写一个应用程序,最终涉及到可并行化的部分: two dimensional float initialData and result arrays for each cell (a, b) in result array:…
如何使用 clSetKernelArg 在 OpenCL Haskell 程序中设置本地内存大小?
我正在使用 Luis Cabellos 的 System.GPU.OpenCL 模块来控制 OpenCL 内核。 一切运行良好,但为了加快速度,我尝试将一些全局内存缓存到本地缓冲区中…