当前位置：文江博客话题详情

multithreading synchronization cpu-architecture

多核处理器的关键部分

发布于 2024-07-24 15:39:47 字数 382 浏览 6 评论 0原文

对于单核处理器，所有线程都从一个 CPU 运行，对内存中的某些互斥体（或信号量等）使用原子测试和设置操作来实现关键部分的想法似乎很简单；因为您的处理器正在从程序中的一个位置执行测试和设置，所以它不一定可以从程序中伪装成其他线程的另一位置执行测试和设置。

但是，当您实际上拥有多个物理处理器时会发生什么呢？似乎简单的指令级原子性是不够的，因为两个处理器可能同时执行其测试和设置操作，您真正需要维护原子性的是访问共享内存位置互斥体。（如果共享内存位置加载到缓存中，则还需要处理整个缓存一致性问题。）

这似乎会比单核情况产生更多的开销，所以这里是问题的核心：如何更糟糕的是吗？是不是更糟了？我们就只能忍受它吗？或者通过强制执行进程组中的所有线程都必须位于同一物理核心上的策略来回避它？

收藏 0

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

评论（6）

救星 2024-07-31 15:39:48

内存访问由内存控制器处理，内存控制器应该处理多核问题，即它不应该允许同时访问相同的地址（可能通过内存页或内存行处理）。因此，您可以使用一个标志来指示另一个处理器是否正在更新某个块的内存内容（这可以避免更新部分记录但不是全部记录的脏读类型）。

如果处理器具有这样的功能，则更优雅的解决方案是使用硬件信号量块。硬件信号量是一个简单的队列，其大小可能为 no_of_cores -1。 TI 的 6487/8 处理器就是这样。您可以直接查询信号量（并循环直到它被释放），也可以进行间接查询，这将在核心获取资源后导致中断。请求按照发出的顺序排队并提供服务。信号量查询是一个原子操作。

缓存一致性是另一个问题，在某些情况下您可能需要进行缓存写回和刷新。但这是一个非常特定于缓存实现的事情。对于 6487/8，我们需要通过一些操作来做到这一点。

回复收藏 0 原文

笑梦风尘 2024-07-31 15:39:48

那么，根据您家里放置的计算机类型，执行以下操作：编写一个简单的多线程应用程序。在单核（Pentium 4 或 Core Solo）上运行此应用程序，然后在多核处理器（Core 2 Duo 或类似处理器）上运行它，看看加速有多大。

当然，这些比较是不公平的，因为无论内核如何，Pentium 4 和 Core Solo 都比 Core 2 Duo 慢得多。也许可以将 Core 2 Duo 和 Core 2 Quad 与可以使用 4 个或更多线程的应用程序进行比较。

您提出了一些有效的观点。多个处理器会带来很多麻烦和开销。然而，我们只能忍受它们，因为如果关键部分足够长，并行性的速度提升可能远远超过它们。

至于您关于将所有线程放在同一物理核心上的最后建议，这完全违背了多核计算机的意义！

回复收藏 0 原文

凹づ凸ル 2024-07-31 15:39:47

多核/SMP 系统不仅仅是几个粘合在一起的 CPU。明确支持并行处理事情。所有同步原语都是在硬件的帮助下按照原子CAS的方式实现的。该指令要么锁定 CPU 和内存控制器（以及执行 DMA 的设备）共享的总线并更新内存，要么仅依赖缓存监听。这反过来会导致缓存一致性算法启动，强制所有相关方刷新其缓存。

免责声明 - 这是非常基本的描述，这里还有更多有趣的内容，例如虚拟缓存与物理缓存、缓存回写策略、内存模型、围栏等。

如果您想了解有关操作系统如何使用这些硬件设施的更多信息 - 这是一本优秀的书关于该主题。

回复收藏 0 原文

无语# 2024-07-31 15:39:47

多核 cpu 的供应商必须注意不同的核心在执行保证原子内存访问的指令时进行自我协调。

例如，在英特尔芯片上，您有“cmpxchg”指令。它将存储在内存位置的值与预期值进行比较，如果两者匹配，则将其交换为新值。如果在它前面加上“lock”指令，则保证它对于所有核心都是原子的。

回复收藏 0 原文

花期渐远 2024-07-31 15:39:47

您需要进行测试和设置，以强制处理器通知所有其他核心的操作，以便它们了解。是的，这会带来开销，您必须忍受它。这是以这样的方式设计多线程应用程序的原因：它们不会太频繁地等待同步原语。

回复收藏 0 原文

流星番茄 2024-07-31 15:39:47

或者通过强制执行进程组中的所有线程都必须位于同一物理核心上的策略来回避它？

这将取消多线程的全部意义。当您使用锁、信号量或其他同步技术时，无论您使用多少个内核，您都依赖操作系统来确保这些操作是互锁的。

释放锁后切换到不同线程的时间主要取决于上下文切换的成本。此 SO 线程处理上下文切换开销，因此您可能想检查一下。

还有一些其他有趣的线程：

您应该阅读此 MSDN另请参阅文章：了解多线程应用中低锁定技术的影响。

回复收藏 0 原文

~没有更多了~

关于作者

独留℉清风醉

暂无简介

0 文章

0 评论

23 人气

关注发私信

相关话题

热门标签

操作系统程序设计 IT运维 Linux系统管理 JavaScript 服务器应用 solaris C/C++ PHP Shell BSD Vue.js aix Oracle Python HTML 系统管理 HTML5 CSS 前端

推荐作者

1CH1MKgiKxn9p

文章 0 评论 0

ゞ记忆︶ㄣ

文章 0 评论 0

JackDx

文章 0 评论 0

信远

文章 0 评论 0

yaoduoduo1995

文章 0 评论 0

霞映澄塘

文章 0 评论 0

友情链接

我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的隐私政策了解更多相关信息。单击 接受 或继续使用网站，即表示您同意使用 Cookies 和您的相关数据。

原文