当前位置：文江博客话题详情

malloc/memcpy 函数在 NUMA 上独立运行吗？

发布于 2024-10-27 06:28:32 字数 372 浏览 4 评论 0原文

在尝试提高非 NUMA/标准 PC 上应用程序的速度时，我总是发现瓶颈是对 malloc() 的调用，因为即使在多核计算机中，它也是在所有计算机之间共享/同步的。核心。

我有一台使用 Linux 和 C 的 NUMA 架构 PC，我有两个问题：

在 NUMA 机器中，由于每个核心都有自己的内存，malloc() 将在每个核心上独立执行/内存而不阻塞其他核心？
在这些架构中，如何调用 memcpy() ？这可以在每个核心上独立调用吗？或者，在一个核心中调用它会阻止其他核心？我可能错了，但我记得 memcpy() 也遇到了与 malloc() 相同的问题，即当一个核心正在使用它时，其他核心必须等待。

需要登录才能够评论，你可以免费注册一个本站的账号。

NUMA机器是一个共享内存系统，因此任何处理器的内存访问都可以无阻塞地到达内存。如果存储器模型是基于消息的，则访问远程存储器将需要执行处理器请求本地处理器执行所需的操作。然而，在 NUMA 系统中，远程处理器仍然可能由于使用内存链接而影响近距离处理器的性能，尽管这可能取决于特定的架构配置。

至于1，这完全取决于操作系统和malloc库。操作系统负责将每个核心/每个处理器的内存呈现为统一空间或 NUMA。 Malloc 可能支持或不支持 NUMA。但从根本上来说，malloc 实现可能能够也可能不能与其他请求同时执行。 Al 的回答（以及相关的讨论）更详细地解决了这一点。

至于 2，由于 memcpy 由一系列加载和存储组成，唯一的影响将再次是使用其他处理器的内存控制器等的潜在架构影响。

来世叙缘 2024-11-03 06:28:32

无论您是否使用 NUMA 架构，单独进程中对 malloc 的调用都将独立执行。同一进程的不同线程中对 malloc 的调用不能独立执行，因为返回的内存对于进程内的所有线程来说都是平等可访问的。如果您想要特定线程的本地内存，请阅读线程本地存储。我还没有找到任何明确的文档来说明 Linux VM 和调度程序是否能够优化内核、线程、本地内存和线程本地存储之间的关联性。

~没有更多了~