如何在不同处理器之间分配负载

发布于 2024-10-31 14:55:53 字数 104 浏览 5 评论 0原文

我正在一台机器上运行一些并行代码，该机器有 4 个英特尔处理器，每个处理器有 8 个核心。我正在使用 TBB。假设给定的循环（我并行化）有 X 次迭代，我应该如何选择我的粒度以确保负载均匀分配？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

情感失落者 2024-11-07 14:55:53

假设您有 N 个同样强大的 CPU。

如果没有循环携带依赖项（例如，迭代 i 中没有任何内容被后续迭代使用），那么您可以简单地在 CPU 1 上运行循环迭代 0..X/N，以及迭代 (X/N)+1..( 2*X/N) 在 CPU 2 等上，假设每次迭代花费完全相同的时间，或者至少平均时间变化不大。

如果有有循环进行
依赖关系，如果迭代 i 依赖于所有先前的迭代，您可能会遇到问题。如果它仅取决于之前的 k 次迭代，则可以让 CPU1 执行迭代 0..X/N，CPU2 执行迭代 X/Nk..(2*X/N)，浪费一些工作，但允许 CPU2 收集所有处理器所需的结果等。

如果迭代所花费的时间差异很大，那么您最好设置一个包含迭代的工作列表，
并让 CPU 在完成之前的迭代时从工作列表中获取迭代。这样，随着需求的出现，工作就被分配了。你必须确保每单位工作所花费的时间远大于完成工作所付出的努力，否则你将无法获得同等的优势；实现此目的的一种方法是从工作列表中获取小范围的迭代，使得该范围内的总工作显着超过调度开销。

回复收藏 0 原文