当前位置：文江博客话题详情

multithreading x86 c++ multicore cpu-cache

我可以在多核 x86 CPU 上强制缓存一致性吗？

发布于 2024-07-13 23:29:42 字数 397 浏览 10 评论 0原文

前一周，我编写了一个小线程类和一个单向消息管道，以允许线程之间进行通信（显然，每个线程有两个管道，用于双向通信）。在我的 Athlon 64 X2 上一切正常，但我想知道如果两个线程都在查看同一个变量并且每个核心上该变量的本地缓存值不同步，我是否会遇到任何问题。

我知道易失关键字将强制从内存中刷新变量，但是在多核x86处理器上有没有办法强制所有核心的缓存同步？这是我需要担心的事情吗，还是 易失性 和正确使用轻量级锁定机制（我使用 _InterlockedExchange 来设置我的易失性管道变量）可以处理我想编写“无锁”的所有情况多核 x86 CPU 的代码？

我已经了解并使用过临界区、互斥体、事件等。我主要想知道是否有 x86 内在函数我不知道哪些力量或可用于强制缓存一致性。

收藏 0

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

评论（9）

风尘浪孓 2024-07-20 23:29:43

易失性仅强制您的代码重新读取该值，它无法控制从何处读取该值。如果您的代码最近读取了该值，那么它可能会在缓存中，在这种情况下，易失性将强制从缓存中重新读取它，而不是从内存中。

x86 中没有太多缓存一致性指令。有诸如 prefetchnta 之类的预取指令，但这并不影响内存排序语义。它过去是通过将值带到 L1 缓存而不污染 L2 来实现的，但对于具有大型共享包容性 L3 缓存的现代英特尔设计来说，事情变得更加复杂。

x86 CPU 使用 MESI 协议（Intel 的 MESIF，AMD 的 MOESI）的变体来保持其缓存相互一致（包括不同核心的私有L1缓存）。想要写入缓存行的核心必须强制其他核心使其副本无效，然后才能将其自己的副本从共享状态更改为修改状态。

您不需要任何栅栏指令（如 MFENCE）在一个线程中生成数据并在 x86 上的另一个线程中使用它，因为 x86 加载/存储具有获取/释放语义内置。您确实需要 MFENCE（全屏障）来获得顺序一致性。（此答案的先前版本建议需要 clflush ，这是不正确的）。

您确实需要防止编译时重新排序，因为 C++ 的内存模型是弱有序的。 volatile 是一种古老的、糟糕的方法； C++11 std::atomic 是编写无锁代码的更好方法。

回复收藏 0 原文

寂寞花火° 2024-07-20 23:29:43

由于 x86 处理器采用 MESI 协议，因此保证了内核之间的缓存一致性。在处理可能访问内存而数据仍位于核心缓存上的外部硬件时，您只需要担心内存一致性。不过，这看起来不像你的情况，因为文本表明你正在用户区编程。

回复收藏 0 原文

原来分手还会想你 2024-07-20 23:29:43

您无需担心缓存一致性。硬件会解决这个问题。您可能需要担心的是由于缓存一致性而导致的性能问题。

如果 core#1 写入变量，则会使其他核心中缓存行的所有其他副本无效（因为它必须获取

由于必须从内存中读取整个缓存行（64 字节）（或写回共享缓存，然后由 core#2 读取），因此会产生一些性能成本。在这种情况下，这是不可避免的。这是期望的行为。

问题是，当同一缓存行中有多个变量时，即使核心在同一缓存行中读取/写入不同的变量，处理器也可能会花费额外的时间来保持缓存同步。

通过确保这些变量不在同一缓存行中可以避免该成本。这种效果被称为“错误共享”，因为您强制处理器同步实际上不在线程之间共享的对象的值。

回复收藏 0 原文

茶花眉 2024-07-20 23:29:43

挥发性不行。在 C++ 中，易失性仅影响编译器优化，例如将变量存储在寄存器而不是内存中，或者完全删除它。

回复收藏 0 原文

我要还你自由 2024-07-20 23:29:43

您没有指定您使用的编译器，但如果您使用的是 Windows，请查看本文位于此处。另请查看可用的此处的同步函数。您可能需要注意，一般来说，易失性不足以执行您希望它执行的操作，但在 VC 2005 和 2008 下，添加了非标准语义，从而在周围添加了隐含的内存屏障读和写。

如果你想让东西便携，你前面的路将会更加艰难。

回复收藏 0 原文

混吃等死 2024-07-20 23:29:43

此处有一系列解释现代内存架构的文章，包括Intel Core2 缓存以及更多现代架构主题。

文章非常具有可读性并且插图精美。享受！

回复收藏 0 原文

ぃ弥猫深巷。 2024-07-20 23:29:43

您的问题中有几个子问题，因此我将尽我所知回答它们。

目前还没有在 C++ 中实现无锁交互的可移植方法。 C++0x 提案通过引入原子库解决了这个问题。
Volatile 不保证在多核上提供原子性，并且其实现是特定于供应商的。
在 x86 上，您不需要执行任何特殊操作，除了将共享变量声明为易失性，以防止某些可能破坏多线程代码的编译器优化。易失性告诉编译器不要缓存值。
有些算法（例如 Dekker）即使在具有易失性变量的 x86 上也无法工作。
除非您确定在线程之间传递数据访问是程序中的主要性能瓶颈，否则请远离无锁解决方案。使用按值或锁传递数据。

回复收藏 0 原文

べ繥欢鉨o。 2024-07-20 23:29:43

以下是一篇关于在线程程序中使用易失性的好文章。

易失性对于多线程编程几乎没用。

回复收藏 0 原文

一杆小烟枪 2024-07-20 23:29:43

Herb Sutter 似乎只是建议任何两个变量应该驻留在单独的缓存行上。他在并发队列中通过锁和节点指针之间的填充来执行此操作。

编辑：如果您使用的是 Intel 编译器或 GCC，则可以使用原子内置函数，它们似乎尽最大努力在可能的情况下抢占缓存。

回复收藏 0 原文

~没有更多了~

关于作者

暂无简介

0 文章

0 评论

23 人气

关注发私信

相关话题

热门标签

操作系统程序设计 IT运维 Linux系统管理 JavaScript 服务器应用 solaris C/C++ PHP Shell BSD Vue.js aix Oracle Python HTML 系统管理 HTML5 CSS 前端

推荐作者

1CH1MKgiKxn9p

文章 0 评论 0

ゞ记忆︶ㄣ

文章 0 评论 0

JackDx

文章 0 评论 0

信远

文章 0 评论 0

yaoduoduo1995

文章 0 评论 0

霞映澄塘

文章 0 评论 0

友情链接

我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的隐私政策了解更多相关信息。单击 接受 或继续使用网站，即表示您同意使用 Cookies 和您的相关数据。

原文