MATLAB 并行计算工具箱 - 并行化与 GPU？

发布于 2024-12-05 18:06:59 字数 530 浏览 1 评论 0原文

我正在与某人合作，他们拥有一些想要加速的 MATLAB 代码。他们目前正在尝试将所有这些代码转换为 CUDA，使其能够在 CPU 上运行。我认为使用 MATLAB 的并行计算工具箱来加速这一过程会更快，并在具有 MATLAB 分布式计算工具箱的集群上运行它，从而允许我在多个不同的工作节点上运行它。现在，作为并行计算工具箱的一部分，您可以使用诸如 GPUArray 之类的东西。但是，我对这将如何运作感到困惑。使用诸如 parfor（并行化）和 gpuarray（GPU 编程）之类的东西是否彼此兼容？我可以同时使用两者吗？是否可以将某些内容拆分到不同的工作节点（并行化），同时还利用每个工作节点上可用的任何 GPU？

他们认为仍然值得探索将所有 matlab 代码转换为 cuda 代码以在具有多个 GPU 的机器上运行所需的时间……但我认为正确的方法是使用 MATLAB 中已内置的功能。

任何帮助、建议、指导将不胜感激！

谢谢！

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

机场等船 2024-12-12 18:06:59

当您使用 parfor 时，您可以有效地将 for 循环划分为多个任务，每个循环迭代一个任务，并将这些任务拆分为由多个工作线程并行计算，其中每个工作线程可以被视为一个 MATLAB 会话，无需交互式 GUI 。您将集群配置为在集群的每个节点上运行指定数量的工作线程（通常，您会选择运行等于该节点上可用处理器核心数量的工作线程数量）。

另一方面，gpuarray 向 MATLAB 表明您希望使矩阵可供 GPU 处理。在幕后，MATLAB 将数据从主存储器编组到图形板的内部存储器。某些 MATLAB 函数（文档中提供了它们的列表）可以在 gpuarray 上运行，并且计算在 GPU 上进行。

两种技术之间的主要区别在于 parfor 计算发生在直接访问主内存的集群节点的 CPU 上。 CPU 内核通常具有较高的时钟速率，但 CPU 集群中的 CPU 内核数量通常少于 GPU 内核。单独来看，GPU 核心比典型的 CPU 核心慢，并且它们的使用需要将数据从主内存传输到视频内存，然后再返回，但集群中有更多的 GPU 核心。据我所知，混合方法应该是可能的，其中您有一组 PC，每台 PC 都有一个或多个 Nvidia Tesla 板，并且您同时使用 parfor 循环和 gpuarray。不过，我还没有机会尝试这个。

回复收藏 0 原文

高冷爸爸 2024-12-12 18:06:59

如果您主要对模拟感兴趣，GPU 处理是完美的选择。但是，如果您想分析（大）数据，请选择并行化。原因是，如果不需要来回复制数据，GPU 处理只会比 CPU 处理更快。如果进行模拟，您可以在 GPU 上生成大部分数据，只需将结果复制回来即可。如果您尝试在 GPU 上处理更大的数据，您经常会遇到内存不足的问题。
如果您的计算机 CPU 具有大数据结构和 2 个以上内核，那么并行化会非常有用。

回复收藏 0 原文