当前位置：文江博客话题详情

multithreading numa papi

如何统计对远程 NUMA 内存节点的内存访问？

发布于 2024-11-29 02:22:02 字数 219 浏览 5 评论 0原文

在最近的 Linux 分布式共享内存系统上运行的多线程应用程序中，是否有一种直接的方法来计算每个线程对远程（非本地）NUMA 内存节点的请求数量？

我正在考虑使用 PAPI 来计算互连流量。这是要走的路吗？

在我的应用程序中，线程在其整个生命周期中都绑定到特定的核心或处理器。当应用程序开始时，内存按页分配，并以循环方式分布在所有可用的 NUMA 内存节点上。

谢谢您的回答。

收藏 0

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

评论（3）

沙与沫 2024-12-06 02:22:02

如果您有权访问 VTune，则本地和远程 NUMA 节点访问由硬件计数器 OFFCORE_RESPONSE.ANY_DATA.OTHER_LOCAL_DRAM_0 进行计数（用于快速本地 NUMA 节点访问），通过 OFFCORE_RESPONSE.ANY_DATA.REMOTE_DRAM_0 进行较慢的远程 NUMA 节点访问。

计数器在 VTune 中的显示方式：

在 VTune 中配置 NUMA 硬件计数器

计数器在两种情况下的外观：

NUMA 不愉快的代码：核心0（NUMA 节点 0）增加驻留在 NUMA 节点 1 上的 50 MB：
具有许多远程 NUMA 节点访问的 NUMA 不愉快代码

NUMA 满意代码：核心 0（NUMA 节点 0）增加驻留在 NUMA 上的 50 MB节点 0：
具有许多本地 NUMA 节点访问的 NUMA 快乐代码

回复收藏 0 原文

欲拥i 2024-12-06 02:22:02

我找到了 Intel PCM 附带的 pcm-numa.x 工具非常有用。它告诉您每个核心访问本地或远程 NUMA 节点的次数。

回复收藏 0 原文

人海汹涌 2024-12-06 02:22:02

我不确定这是否直接，我也不知道什么是“分布式共享内存系统”，但是，无论如何，在普通的 Linux 上，如果您有权访问源代码，您也许可以自己计算请求数。您可以使用我的“我可以从指针地址获取 NUMA 节点吗？”的答案。问题这里找出请求的内存位于哪个节点，并了解线程所在的节点来统计远程请求。这只会告诉您使用远程内存的频率，而不是该内存何时不在本地缓存中并且必须获取，因此它可能不完全是您想要的。

如果您想了解远程内存上的缓存未命中情况，请尝试将分析标签添加到您的问题中 - 它可能会吸引更多读者。如果有一个分析器可以区分本地内存缺失和远程内存缺失，我也有兴趣找出答案。

回复收藏 0 原文

~没有更多了~

关于作者

暂无简介

文章

评论

26 人气

关注发私信

相关话题

热门标签

操作系统程序设计 IT运维 Linux系统管理 JavaScript 服务器应用 solaris C/C++ PHP Shell BSD Vue.js aix Oracle Python HTML 系统管理 HTML5 CSS 前端

推荐作者

裸钻

文章 0 评论 0

执手闯天涯

文章 0 评论 0

2401825754

文章 0 评论 0

就此别过

文章 0 评论 0

我为君王

文章 0 评论 0

机场等船

文章 0 评论 0

友情链接

我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的隐私政策了解更多相关信息。单击 接受 或继续使用网站，即表示您同意使用 Cookies 和您的相关数据。

原文