当前位置：文江博客话题详情

为什么我的 OpenMP 实现比单线程实现慢？

发布于 2024-10-17 19:20:03 字数 318 浏览 2 评论 0原文

我正在学习 OpenMP 并发性，并尝试了一些现有的代码。在此代码中，我尝试使所有 for 循环并行。然而，这似乎使程序慢得多，至少慢 10 倍，甚至比单线程版本慢得多。

这是代码： http://pastebin.com/zyLzuWU2

我还使用了pthreads，事实证明它更快比单线程版本。

现在的问题是，我在 OpenMP 实现中做错了什么导致速度变慢？

谢谢！

编辑：单线程版本只是没有所有#pragmas 的版本

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

铁轨上的流浪者 2024-10-24 19:20:03

我发现您的代码存在一个问题，即您在非常小的循环（例如 8 或 64 次迭代）中使用 OpenMP。由于开销，这不会有效。如果您想使用 OpenMP 解决 n 皇后问题，请查看 OpenMP 3.0 任务和分支定界问题的线程并行性。

回复收藏 0 原文

天生の放荡 2024-10-24 19:20:03

我认为您的代码太复杂，无法在这里进行审查。我立即发现的一个错误是它甚至不正确。在使用 omp parallel for 进行求和的地方，您必须使用 reduction(+: yourcountervariable) 才能将不同线程的结果正确地组合在一起。否则，一个线程可能会覆盖其他线程的结果。

回复收藏 0 原文