小型 OpenMP 程序有时会冻结（gcc、c、linux）

发布于 2024-10-08 07:50:56 字数 866 浏览 11 评论 0原文

只需编写一个小的 omp 测试，它就不会始终正常工作：

#include <omp.h>
int main() {
  int i,j=0;
#pragma omp parallel
  for(i=0;i<1000;i++)
  {
#pragma omp barrier
    j+= j^i;
  }
  return j;
}

在本示例中，使用 j 从所有线程写入是不正确的，但是

必须只有不确定的值j
我冻结了。

使用 gcc-4.3.1 -fopenmp ac -o gcc -static 编译

在 4 核 x86_Core2 Linux 服务器上运行：$ ./gcc 并冻结（有时；例如 1冻结 4-5 次快速运行）。

Strace：

[pid 13118] futex(0x80d3014, FUTEX_WAKE, 1) = 1
[pid 13119] <... futex resumed> )       = 0
[pid 13118] futex(0x80d3020, FUTEX_WAIT, 251, NULL <unfinished ...>
[pid 13119] futex(0x80d3014, FUTEX_WAKE, 1) = 0
[pid 13119] futex(0x80d3020, FUTEX_WAIT, 251, NULL                       
                        <freeze>

为什么我会出现冻结（死锁）？

原文

Just write a small omp test, and it does not work correctly all the times:

#include <omp.h>
int main() {
  int i,j=0;
#pragma omp parallel
  for(i=0;i<1000;i++)
  {
#pragma omp barrier
    j+= j^i;
  }
  return j;
}

The usage of j for writing from all threads is incorrect in this example, BUT

there must be only nondeterministic value of j
I have a freeze.

Compiled with gcc-4.3.1 -fopenmp a.c -o gcc -static

Run on 4-core x86_Core2 Linux server: $ ./gcc and got freeze (sometimes; like 1 freeze for 4-5 fast runs).

Strace:

[pid 13118] futex(0x80d3014, FUTEX_WAKE, 1) = 1
[pid 13119] <... futex resumed> )       = 0
[pid 13118] futex(0x80d3020, FUTEX_WAIT, 251, NULL <unfinished ...>
[pid 13119] futex(0x80d3014, FUTEX_WAKE, 1) = 0
[pid 13119] futex(0x80d3020, FUTEX_WAIT, 251, NULL                       
                        <freeze>

Why do I have a freeze (deadlock)?

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

你げ笑在眉眼 2024-10-15 07:50:56

尝试将 i 设为私有，以便每个循环都有它自己的副本。

现在我有更多时间，我会尝试解释。默认情况下，OpenMP 中的变量是共享的。在某些情况下，默认情况下会将变量设为私有。并行区域不是其中之一（因此 High Performance Mark 的响应是错误的）。在您的原始程序中，您有两个竞争条件 - 一个在 i 上，一个在 j 上。问题出在 i 上的那个。每个线程都会执行循环一定次数，但由于每个线程都会更改 i，因此任何线程执行循环的次数是不确定的。由于所有线程都必须执行屏障才能满足屏障，因此您会想到这样的情况：您将在屏障上挂起，而该屏障永远不会结束，因为并非所有线程都会执行相同的次数。

由于 OpenMP 规范明确指出（OMP 规范 V3.0，第 2.8.3 节屏障构造）“遇到的工作共享区域和屏障区域的顺序必须是
对于团队中的每个线程都是相同的”，您的程序不合规，因此可能具有不确定的行为。

回复收藏 0 原文

薆情海 2024-10-15 07:50:56

您正在尝试从多个线程添加到同一位置。你无法并行地做你想做的事情。如果你想并行求和，你需要将其分成更小的部分，然后收集它们。

a5b 更新：正确的想法，但发现了错误的代码部分。 i 变量由两个线程更改。

回复收藏 0 原文

遇见了你 2024-10-15 07:50:56

@ejd，如果我将 i 标记为私有，我的程序是否合规？

抱歉 - 我刚刚看到这个问题。从技术上讲，如果您将变量“i”标记为私有，您的程序将符合 OpenMP 标准。然而，“j”上仍然存在竞争条件，尽管您的程序符合要求（因为存在存在竞争条件的有效情况），但“j”的值未指定（根据 OpenMP 规范）。

在您之前的回答之一中，您说过您正在尝试衡量屏障实施的速度。您可能需要查看多个“基准”，它们已发布各种 OpenMP 构造的结果。其中一份由 Mark Bull（EPCC、爱丁堡大学）编写，另一份 (Sphinx) 来自劳伦斯利弗莫尔国家实验室 (LLNL)，第三份 (Parkbench) 来自日本计算合作伙伴。他们可能会为您提供一些指导。

回复收藏 0 原文

~没有更多了~