为什么 pthread 互斥体被认为“较慢”？比 futex？

发布于 2024-11-15 12:55:54 字数 237 浏览 9 评论 0原文

为什么 POSIX 互斥体被认为比 futex 更重或更慢？ pthread 互斥类型的开销来自哪里？我听说 pthread 互斥体基于 futexes，并且在无争议时，不要对内核进行任何调用。看来 pthread 互斥体只是 futex 的“包装器”。

开销是否仅仅在于函数包装器调用以及互斥函数“设置”futex 的需要（即，基本上是 pthread 互斥函数调用的堆栈设置）？或者 pthread 互斥体是否发生了一些额外的内存屏障步骤？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

把昨日还给我 2024-11-22 12:55:54

创建 Futex 是为了提高 pthread 互斥体的性能。 NPTL 使用 futexes，LinuxThreads 早于 futexes，我认为这是“较慢”考虑的来源。 NPTL 互斥体可能有一些额外的开销，但应该不会太多。

编辑：
实际的开销基本上包括：

为互斥体类型选择正确的算法（正常、递归、自适应、错误检查；正常、鲁棒、优先级继承、优先级保护），其中代码向编译器强烈暗示我们正在可能使用普通的互斥体（因此它应该将其传达给 CPU 的分支预测逻辑），
并且如果我们设法获取互斥体的当前所有者，则写入通常应该很快，因为它驻留在同一高速缓存行中作为我们刚刚获取的实际锁，除非该锁存在严重竞争，并且在我们获取该锁和尝试写入所有者之间有其他 CPU 访问了该锁（正常互斥体不需要此写入，但错误检查需要该写入）和递归互斥体）。

因此，几个周期（典型情况）到几个周期+分支错误预测+额外的缓存未命中（最坏的情况）。

回复收藏 0 原文

勿忘初心 2024-11-22 12:55:54

对您问题的简短回答是，众所周知，futex 的实现尽可能高效，而 pthread 互斥体可能会也可能不会。至少，pthread 互斥体具有与确定互斥体类型相关的开销，而 futex 则没有。因此，futex 几乎总是至少与 pthread 互斥体一样高效，除非有人想出某种比 futex 更轻的结构，然后发布一个将其用作默认互斥体的 pthreads 实现。

回复收藏 0 原文

述情 2024-11-22 12:55:54

从技术上讲，pthread 互斥体并不比 futex 慢或快。 pthread 只是一个标准 API，因此它们的快慢取决于该 API 的实现。

特别是在 Linux 中，pthread 互斥体被实现为 futexes，因此速度很快。实际上，您不想使用 futex API 本身，因为它很难使用，在 glibc 中没有适当的包装函数，并且需要在汇编中进行编码，这将是不可移植的。对我们来说幸运的是，glibc 维护者已经在 pthread 互斥 API 的框架下为我们编写了所有这些代码。

现在，因为大多数操作系统没有实现 futexes，所以程序员通常所说的 pthread 互斥体是指从 pthread 互斥体的通常实现中获得的性能，即速度较慢。

因此，统计事实是，在大多数兼容 POSIX 的操作系统中，pthread 互斥体是在内核空间中实现的，并且比 futex 慢。在 Linux 中它们具有相同的性能。可能还有其他操作系统在用户空间中实现 pthread 互斥锁（在无竞争的情况下），因此具有更好的性能，但我目前只知道 Linux。

回复收藏 0 原文