如何在支持超线程的多核机器上调度应用程序？

发布于 2024-10-14 16:47:08 字数 842 浏览 15 评论 0原文

我试图更好地了解支持超线程的多核处理器的工作原理。假设我有一个可以使用 MPI 或 OpenMP 或 MPI+OpenMP 编译的应用程序。我想知道它将如何在具有四个 Xeon X7560 @ 2.27GHz 处理器且每个处理器核心都启用了超线程的 CentOS 5.3 机器上进行调度。

/proc/cpuinfo 中处理器的编号为 0 到 63。据我了解，有四个 8 核物理处理器，总共 PHYSICAL CORES 为 32 个，每个处理器核心都启用了超线程，总共 LOGICAL 处理器为 64 个。

用 MPICH2 编译如果我使用 mpirun -np 16 运行，将使用多少个物理核心？它是否被划分为可用的 16 个物理核心或 16 个逻辑处理器（8 个物理核心使用超线程）？
使用 OpenMP 编译如果我设置 OMP_NUM_THREADS=16，将使用多少个物理核心？它将使用 16 个逻辑处理器吗？
使用 MPICH2+OpenMP 编译如果我设置 OMP_NUM_THREADS=16 并使用 mpirun -np 16 运行，将使用多少个物理内核？
使用 OpenMPI 编译

OpenMPI 有两个运行时选项

-cpu-set 指定分配给作业的逻辑 cpu， -cpu-per-proc 指定每个进程使用的 cpu 数量。

如果使用 mpirun -np 16 -cpu-set 0-15 运行，它只会使用 8 个物理核心吗？
如果使用 mpirun -np 16 -cpu-set 0-31 -cpu-per-proc 2 运行，它将如何调度？

谢谢杰瑞

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

春夜浅 2024-10-21 16:47:08

如果可能的话，我希望任何明智的调度程序都更喜欢在不同的物理处理器上运行线程。然后我预计它会更喜欢不同的物理核心。最后，如果必须的话，它将开始在每个物理核心上使用超线程第二线程。

基本上，当线程必须共享处理器资源时，它们会减慢速度。因此，最佳策略通常是尽量减少处理器资源共享量。对于 CPU 密集型进程来说，这是正确的策略，并且操作系统通常认为它正在处理这种情况。

回复收藏 0 原文

撩发小公举 2024-10-21 16:47:08

我大胆猜测调度程序将尝试将线程保留在同一物理核心上的一个进程中。因此，如果您有 16 个线程，它们将位于最少数量的物理内核上。造成这种情况的原因是缓存局部性；与来自不同进程的线程相比，来自同一进程的线程更有可能接触相同的内存。（例如，跨核心的高速缓存行失效的成本很高，但同一核心中的逻辑处理器不会发生这种成本）。

回复收藏 0 原文