PBS(扭矩)未能将四核处理器视为 4 个处理器

发布于 2024-07-22 21:21:36 字数 666 浏览 10 评论 0原文

我有一个 Debian 集群,每个集群有 2 个节点和两个四核处理器。 我使用 Torque 和 Maui 作为调度程序。 当我尝试运行具有 16 个进程的 MPI 作业时,调度程序无法运行该作业:要么将其放入队列(尽管当时没有任何作业在运行),要么运行并且生成的输出文件显示:您尝试仅使用 4 个处理器运行 16 个进程的作业。

我的 .../pbs/server_priv/nodes 文件如下所示:

node1 np=8
node2 np=8

我用来运行该程序的脚本示例如下:

#!/bin/sh



#PBS -d /home/bellman/

#PBS -N output
#PBS -k oe
#PBS -j oe
#PBS -l nodes=2:ppn=8,walltime=10000:00:00
#PBS -V

ulimit -s 536870912

# How many procs do I have?
NP=$(wc -l $PBS_NODEFILE | awk '{print $1}')
echo Number of processors is $NP


mpiexec -np 16 /home/bellman/AAA

我尝试了节点和 ppn 的很多组合,但发生了两个错误之一。 对正在发生的事情有什么想法吗?

I have a Debian cluster with 2 nodes and two quad-core processors each. I use Torque and Maui as scheduler. When I try to run an MPI job with 16 processes, the scheduler is not able to run the job: either it puts it to the queue (although there is not any job runing at that moment) or runs and the resulting output file says that you was trying to run a 16 processes job with only 4 processors.

my .../pbs/server_priv/nodes file looks as follows:

node1 np=8
node2 np=8

and an example of the script I'm using to run the program is the following:

#!/bin/sh



#PBS -d /home/bellman/

#PBS -N output
#PBS -k oe
#PBS -j oe
#PBS -l nodes=2:ppn=8,walltime=10000:00:00
#PBS -V

ulimit -s 536870912

# How many procs do I have?
NP=$(wc -l $PBS_NODEFILE | awk '{print $1}')
echo Number of processors is $NP


mpiexec -np 16 /home/bellman/AAA

I tried lots of combinations of nodes and ppn, but one of the two errors happen. Any ideas on what is going on?

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

听闻余生 2024-07-29 21:21:36

你试过了吗 :

#PBS -l nodes=2:ncpus=8,walltime=10000:00:00

Did you try :

#PBS -l nodes=2:ncpus=8,walltime=10000:00:00
~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文