当前位置：文江博客话题详情

OpenMP 开销

发布于 2024-12-03 09:58:58 字数 287 浏览 4 评论 0原文

我使用 OpenMP 和 Intel TBB 并行化了图像卷积和 lu 分解。我正在 1-8 核上进行测试。但是，当我在 OPenMP 和 TBB 中的 1 个核心上尝试时，分别使用 set_num_threads(1) 和 task_scheduler_init InitTBB(1) 指定一个线程；由于 TBB 开销，TBB 性能与顺序代码相比表现出一些小幅下降，但令人惊讶的是 OpenMP 在单核上没有显示任何开销，并且执行与顺序代码完全相同（使用 Intel O3 优化级别）。我正在使用 OpenMP 循环的静态调度。这是现实的还是我犯了一些错误？

收藏 0

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

评论（4）

当梦初醒 2024-12-10 09:58:58

如果您仅使用一个线程运行 OpenMP 运行时，它可能不会创建任何线程。

此外，仅使用 OpenMP 并行化指令有时也会使串行代码运行得更快，因为您实质上为编译器提供了更多信息。例如，工作共享构造告诉编译器循环的迭代是相互独立的，它可能无法自行推断出这一点，并且允许编译器使用更积极的优化策略。当然，并不总是如此，但我已经看到它在“现实世界代码”中发生。

回复收藏 0 原文

暖树树初阳… 2024-12-10 09:58:58

OpenMP 是编译器完成所有工作的地方。如果编译器知道它将始终是串行代码，那么它可以完全合法地跳过所有并行位。

据我了解，TBB 基本上只是一个图书馆。总是必须用必要的部分来修饰您的算法，以并行和串行运行它。

回复收藏 0 原文

满身野味 2024-12-10 09:58:58

OpenMP 将代码的修饰部分 (#pragma omg for/parallel) 分叉到主线程（也可以在没有 OpenMP 的情况下执行）和其他线程中。

如果您配置为仅使用 1 个线程，则这只是主线程，就像没有 OpenMP 指令一样执行。没有开销，因为执行路径没有分叉。

回复收藏 0 原文

萌逼全场 2024-12-10 09:58:58

OpenMP 的特点是编译器会为您完成工作，它需要对顺序代码进行最少的修改，并且如果分配给每个线程的任务非常大，通常会给出一些不错的结果。我建议尝试使用 Pthread 或 c++11 上的线程测试您的代码并查看结果。

回复收藏 0 原文

~没有更多了~

关于作者

吾性傲以野

暂无简介

文章

评论

27 人气

关注发私信

相关话题

热门标签

操作系统程序设计 IT运维 Linux系统管理 JavaScript 服务器应用 solaris C/C++ PHP Shell BSD Vue.js aix Oracle Python HTML 系统管理 HTML5 CSS 前端

推荐作者

十二

文章 0 评论 0

飞烟轻若梦

文章 0 评论 0

OPleyuhuo

文章 0 评论 0

wxb0109

文章 0 评论 0

旧城空念

文章 0 评论 0

-小熊_

文章 0 评论 0

友情链接

我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的隐私政策了解更多相关信息。单击 接受 或继续使用网站，即表示您同意使用 Cookies 和您的相关数据。

原文