原子引用计数共享不可变数据是否需要内存屏障？

发布于 2024-08-27 18:19:47 字数 439 浏览 22 评论 0原文

我有一些不可变的数据结构，我想使用引用计数来管理它们，并在 SMP 系统上的线程之间共享它们。

发布代码如下所示：

void avocado_release(struct avocado *p)
{
    if (atomic_dec(p->refcount) == 0) {
        free(p->pit);
        free(p->juicy_innards);
        free(p);
    }
}

atomic_dec 中需要内存屏障吗？如果是这样，什么样的内存屏障？

附加说明：该应用程序必须在 PowerPC 和 x86 上运行，因此欢迎任何特定于处理器的信息。我已经了解 GCC 原子内置函数。至于不变性，引用计数是唯一在对象的持续时间内发生变化的字段。

原文

I have some immutable data structures that I would like to manage using reference counts, sharing them across threads on an SMP system.

Here's what the release code looks like:

void avocado_release(struct avocado *p)
{
    if (atomic_dec(p->refcount) == 0) {
        free(p->pit);
        free(p->juicy_innards);
        free(p);
    }
}

Does atomic_dec need a memory barrier in it? If so, what kind of memory barrier?

Additional notes: The application must run on PowerPC and x86, so any processor-specific information is welcomed. I already know about the GCC atomic builtins. As for immutability, the refcount is the only field that changes over the duration of the object.

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

提赋 2024-09-03 18:19:47

在 x86 上，它将变成 lock 前缀汇编指令，如 LOCK XADD。
作为一条指令，它是不可中断的。作为附加的“功能”，lock 前缀会导致完整的内存屏障：

“...锁定操作序列化所有未完成的加载和存储操作（即等待它们完成）。” ...“锁定操作相对于所有其他内存操作和所有外部可见事件而言是原子的。只有取指和页表访问才能传递锁定指令。锁定指令可用于同步一个处理器写入的数据和另一处理器读取的数据”。 - 英特尔® 64 和 IA-32 架构软件开发人员手册，第 8.1 章.2.

实际上，内存屏障在 .NET和x86/x64 上的 JAVA JIT，因为 mfence 在许多 CPU 上速度较慢，即使它保证可用，就像在 64 位模式下一样。（lock xchg 是否与 mfence 具有相同的行为？)
因此，无论您是否喜欢，您都可以在 x86 上拥有完整的围栏作为额外的好处。 :-)

在 PPC 上，情况有所不同。 LL/SC 对 - lwarx & stwcx - 内部有减法，可用于将内存操作数加载到寄存器中，减一，然后如果没有其他存储到目标位置，则将其写回，或者重试整个循环（如果有）。 LL/SC 可以被中断（意味着它将失败并重试）。
它也不意味着自动完整围栏。
然而，这不会以任何方式损害计数器的原子性。
这只是意味着在 x86 情况下，您碰巧也“免费”获得了栅栏。
_{在 PPC 上，可以通过发出来插入（部分或）完整栅栏(lw)sync 指令。}

总而言之，显式内存屏障对于原子计数器的正常工作来说并不是必需的。