当前位置：文江博客话题详情

为什么 CUDA 和 OpenCL 中的 GPU 线程分配在网格中？

发布于 2024-08-03 02:19:36 字数 306 浏览 14 评论 0原文

我刚刚学习 OpenCL，并且我正在尝试启动内核。为什么GPU线程是在网格中管理的？

我将详细阅读有关此内容的更多内容，但最好有一个简单的解释。使用 GPGPU 时总是这样吗？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

绅刃 2024-08-10 02:19:36

这是一种常见的方法，在 CUDA、OpenCL 和我认为 ATI 流中都有使用。

网格背后的想法是在正在处理的数据和执行数据处理的线程之间提供简单但灵活的映射。在 GPGPU 执行模型的简单版本中，为 1D、2D 或 3D 数据网格中的每个输出元素“分配”一个 GPU 线程。为了处理该输出元素，线程将从输入数据网格中的相应位置或相邻位置读取一个（或多个）元素。通过将线程组织在网格中，线程可以更轻松地确定要读取哪些输入数据元素以及在哪里存储输出数据元素。

这与常见的多核 CPU 线程模型形成鲜明对比，在常见的多核 CPU 线程模型中，每个 CPU 核心分配一个线程，每个线程处理许多输入和输出元素（例如，四核系统中的 1/4 数据）。

回复收藏 0 原文