第 2 页 - opencl - 文江博客

投稿关注

opencl

文章 2 浏览 82

如何处理内核中可变数量的算法？

我正在捕获视频帧。每个帧都作为 Image2D 传递到内核中。我有大约五种简单的图像处理算法（模糊、锐化等），用户可以选择它们（也可以组合不同的算法…

少女情怀诗 2025-01-04 06:44:41 0 0

OpenCL：NVIDIA 的矢量寄存器（float4、float8、..） VS Intel 的矢量寄存器

我知道对于 Intel，矢量寄存器已经过优化，例如 SandyBridge 微架构（SSE+AVX），但是对于 NVIDIA 的 GPU 又如何呢？我在某处读到的一些资料（我忘了…

雅心素梦 2025-01-04 05:48:33 0 0

OpenCL CPU 设备与 GPU 设备

考虑一个简单的例子：向量加法。如果我为 CL_DEVICE_TYPE_GPU 构建一个程序，并为 CL_DEVICE_TYPE_CPU 构建相同的程序，它们之间有什么区别（除了“C…

心房的律动 2025-01-03 21:01:11 0 0

OpenCL：long、long4、long16...什么时候使用？

我试图理解仅使用 long、long2、long3、long4、long8、long16 之间的区别。假设我的 CL_DEVICE_PREFERRED_VECTOR_WIDTH_LONG 为 2。我什么时候应该使…

妄想挽回 2025-01-03 19:09:07 0 0

在代码中共享 GPU 资源

我的程序使用 OpenGL 在屏幕上绘图。此任务强度低但对延迟敏感。我的程序的另一个CPU线程进行一些高强度但优先级低的计算。我使用 OpenCL 在 GPU 上运…

风流物 2025-01-03 02:37:57 0 0

OpenCL：GPU 上的 32 位和 64 位 popcnt 指令？

我想为 GPU（最好是 OpenCL）编写一个程序，并且很大一部分计算包括计算位数组（打包为 long 或 int）中 1 的数量。因此，在现代 CPU 上，我显然只会…

書生途 2025-01-03 00:33:37 0 0

使用 OpenGL/OpenCL 加速每行纹理处理

我有一个渲染步骤，我想在动态生成的纹理上执行。该算法可以独立并行地对行进行操作。对于每一行，算法将以从左到右的顺序访问每个像素并就地修改它…

且行且努力 2025-01-02 12:57:28 0 0

cl_khr_fp64 和 cl_amd_fp64 之间的区别？

我刚刚发现在我的（相当昂贵的）Radeon 6970 上，仅支持 cl_amd_fp64 扩展。使用 cl_amd_fp64 运行时，我在代码的某些部分得到奇怪的结果（访问 0.005…

无言温柔 2025-01-02 05:05:31 1 0

cl::vector 与 std::vector：不同的迭代器行为

编辑：按照 PlasmaHH 的建议添加了带有内存位置的调试输出。我不明白 cl::vector<> 的不同行为在 OpenCL 的 C++ 绑定中。考虑以下代码：标头 Top.hp…

梦纸 2025-01-01 20:09:39 0 0

nVidia Tesla 卡有什么好处吗？

我打算购买一个真正的 GPU 来运行并行算法（预算 2k-4k）。现在，我随处可见配备“专为 GPGPU 制造”的 nVidia Tesla GPU 卡的超级计算机。虽然乍一…

画骨成沙 2025-01-01 03:17:21 2 0

OpenCL 中的字符串格式？

我正在全局内存块中使用环形缓冲区编写简单的调试/日志记录功能。问题是 OpenCL 中缺少任何类似于 snprintf 的函数。有什么建议？要使用一些嵌入式实…

请你别敷衍 2024-12-29 21:44:39 0 0

OpenCL 适合什么类型的代码域？

我阅读了 OpenCL 概述，它指出它适合运行 CPU、GPGPU、DSP 等的代码。但是，从命令参考来看，它似乎都是数学和图像类型操作。我没有看到任何关于字符…

这个俗人 2024-12-29 13:17:31 2 0

为什么会有 CL_DEVICE_MAX_WORK_GROUP_SIZE？

我试图了解 OpenCL 设备（例如 GPU）的体系结构，但我不明白为什么本地工作组中的工作项数量有明确的限制，即常量 CL_DEVICE_MAX_WORK_GROUP_SIZE。 …

划一舟意中人 2024-12-29 12:29:45 1 0

有什么方法可以阻止 OpenCL 内核的执行吗？

有什么方法可以阻止 OpenCL 内核的执行吗？例如，我启动内核，进行一些计算，然后如果满足某些条件则停止它，否则，我会等到它完成： clEnqueueNDRan…

硪扪都還晓 2024-12-29 09:52:56 2 0

为什么 OpenCL 中不允许使用位域？

OpenCL 语言不支持位域。不支持他们的理由是什么？与其他被省略的部分（递归、函数指针……）不同，有明显的理由不支持它们，我没有看到位域。我确信…

暮年慕年 2024-12-29 08:10:54 1 0

共 25 页
上一页
1
2
3
4
5
下一页

关注

卷耳

文章 0 评论 0

关注

佚名

文章 0 评论 0

关注

℉服软

文章 0 评论 0

关注

qq_2gSKZM

文章 0 评论 0

关注

凉宸

文章 0 评论 0

关注

gyhjy

文章 0 评论 0

友情链接

文江博客

opencl

如何处理内核中可变数量的算法？

OpenCL：NVIDIA 的矢量寄存器（float4、float8、..） VS Intel 的矢量寄存器

OpenCL CPU 设备与 GPU 设备

OpenCL：long、long4、long16...什么时候使用？

在代码中共享 GPU 资源

OpenCL：GPU 上的 32 位和 64 位 popcnt 指令？

使用 OpenGL/OpenCL 加速每行纹理处理

cl_khr_fp64 和 cl_amd_fp64 之间的区别？

cl::vector 与 std::vector：不同的迭代器行为

nVidia Tesla 卡有什么好处吗？

OpenCL 中的字符串格式？

OpenCL 适合什么类型的代码域？

为什么会有 CL_DEVICE_MAX_WORK_GROUP_SIZE？

有什么方法可以阻止 OpenCL 内核的执行吗？

为什么 OpenCL 中不允许使用位域？

热门标签

推荐作者

卷耳

佚名

℉服软

qq_2gSKZM

凉宸

gyhjy

友情链接