当前位置：文江博客话题详情

共享内存设置中的 MPI 开销

发布于 2024-08-07 19:15:16 字数 307 浏览 2 评论 0原文

我想要并行化一个程序。对于在共享内存中处理一个大数据结构的线程来说，这并不是那么困难。但我希望能够在集群上使用它，并且我必须选择一种技术来做到这一点。 MPI 是一种想法。

问题是，如果我跳过共享内存专用版本的实现并让 MPI 处理所有情况，MPI（或其他技术）会有什么开销？

更新：

我想在许多计算机上同时生长一个大型数据结构（游戏树）。它的大部分部分仅位于一个集群节点上，但其中一些部分（树的不规则顶部）将不时地共享和同步。

在共享内存机器上，我希望通过共享内存来实现这一点。这可以通用吗？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

瘫痪情歌 2024-08-14 19:15:16

所有流行的 MPI 实现都将通过共享内存进行本地通信。只要您不花费所有时间打包和解包缓冲区（即您的设计合理），性能就非常好。事实上，MPI 强加给您的设计可以比大多数线程实现更好地执行，因为单独的地址空间提高了缓存一致性。为了持续击败 MPI，线程实现必须了解缓存层次结构以及其他内核正在做什么。

对于良好的网络硬件（如 InfiniBand），HCA 负责将缓冲区接入和断开网络，以便 CPU 可以执行其他操作。此外，由于许多作业都受到内存带宽的限制，因此与每个插槽使用多个内核相比，在多个节点上使用例如每个插槽上的 1 个内核，它们的性能会更好。

回复收藏 0 原文

找个人就嫁了吧 2024-08-14 19:15:16

这取决于算法。无论是进程间通信还是进程内的多个线程，明显的集群间通信比共享内存慢几个数量级。因此，您希望最小化集群间流量，例如，通过在可能且可行的情况下复制数据，或者以最小化节点间通信的方式分解问题。

对于节点间通信很少的“令人尴尬”的并行算法，这是一个简单的选择 - 这些问题类似于暴力搜索加密密钥，其中每个节点可以长时间处理数字并定期向中央节点报告，但不需要通信测试键。

回复收藏 0 原文

~没有更多了~

关于作者

吝吻

暂无简介

0 文章

0 评论

22 人气

关注发私信

友情链接

文江博客

共享内存设置中的 MPI 开销

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

qq_FjTq5B

18273202778

WordPress小学生

〃温暖了心ぐ

迷乱花海

niuniu

友情链接

共享内存设置中的 MPI 开销

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

qq_FjTq5B

18273202778

WordPress小学生

〃温暖了心ぐ

迷乱花海

niuniu

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。