当前位置：文江博客话题详情

可以跨 OpenCL 内核在 CPU 和 GPU 上同时运行

发布于 2024-09-09 09:32:27 字数 82 浏览 8 评论 0原文

假设我有一台具有多核处理器和 GPU 的计算机。我想编写一个在平台的所有核心上运行的 OpenCL 程序。这是可能的还是我需要选择一个设备来运行内核？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

深爱不及久伴 2024-09-16 09:32:27

理论上是可以的，CL API 允许这样做。但平台/实现必须支持它，而且我认为大多数 CL 实现都不支持它。

为此，请获取 CPU 设备和 GPU 设备的 cl_device_id，并使用 clCreateContext 创建包含这两个设备的上下文。

回复收藏 0 原文

娜些时光，永不杰束 2024-09-16 09:32:27

不，你不能在 CPU 和 GPU 上自动跨越内核，它要么是其中之一，要么是另一个。

您可以这样做，但这将涉及手动创建和管理两个命令队列（每个设备一个）。

请参阅此线程：
http: //devforums.amd.com/devforum/messageview.cfm?catid=390&threadid=124591&messid=1072238&parentid=0&FTVAR_FORUMVIEWTMP=Single

回复收藏 0 原文

红焚 2024-09-16 09:32:27

一种上下文只能用于一种平台。如果您的多设备代码需要跨平台工作（例如，Intel 平台 CPU OpenCL 和 NVidia GPU），那么您需要单独的上下文。

但是，如果 GPU 和 CPU 碰巧位于同一平台，那么您可以使用同一个上下文。

如果您在同一平台上使用多个设备（两个相同的 GPU，或来自同一制造商的两个 GPU），那么您可以共享上下文 - 只要它们都来自单个 clGetDeviceIDs 调用。

编辑：
我应该补充一点，GPU+CPU 上下文并不意味着任何自动管理的 CPU+GPU 执行。通常，最佳实践是让驱动程序分配可由 GPU 进行 DMA 处理的内存缓冲区，以获得最大性能。如果 CPU 和 GPU 位于同一上下文中，您就可以在两个设备之间共享这些缓冲区。

你还是得自己分担工作量。我最喜欢的负载平衡技术是使用事件。每 n 个工作项，将一个事件对象附加到命令（或将一个标记排队），并等待您在 n 个工作项之前设置的事件（前一个）。如果您不需要等待，那么您需要增加该设备上的 n，如果您确实需要等待，那么您应该减少 n。这将限制队列深度，n 将徘徊在完美深度附近以保持设备繁忙。无论如何你都需要这样做以避免导致 GUI 渲染匮乏。只要在每个命令队列中保留n个命令（其中CPU和GPU有单独的n），它就会完美划分。

回复收藏 0 原文