PBS(扭矩)未能将四核处理器视为 4 个处理器
我有一个 Debian 集群,每个集群有 2 个节点和两个四核处理器。 我使用 Torque 和 Maui 作为调度程序。 当我尝试运行具有 16 个进程的 MPI 作业时,调度程序无法运行该作业:要么将其放入队列(尽管当时没有任何作业在运行),要么运行并且生成的输出文件显示:您尝试仅使用 4 个处理器运行 16 个进程的作业。
我的 .../pbs/server_priv/nodes 文件如下所示:
node1 np=8
node2 np=8
我用来运行该程序的脚本示例如下:
#!/bin/sh
#PBS -d /home/bellman/
#PBS -N output
#PBS -k oe
#PBS -j oe
#PBS -l nodes=2:ppn=8,walltime=10000:00:00
#PBS -V
ulimit -s 536870912
# How many procs do I have?
NP=$(wc -l $PBS_NODEFILE | awk '{print $1}')
echo Number of processors is $NP
mpiexec -np 16 /home/bellman/AAA
我尝试了节点和 ppn 的很多组合,但发生了两个错误之一。 对正在发生的事情有什么想法吗?
I have a Debian cluster with 2 nodes and two quad-core processors each. I use Torque and Maui as scheduler. When I try to run an MPI job with 16 processes, the scheduler is not able to run the job: either it puts it to the queue (although there is not any job runing at that moment) or runs and the resulting output file says that you was trying to run a 16 processes job with only 4 processors.
my .../pbs/server_priv/nodes file looks as follows:
node1 np=8
node2 np=8
and an example of the script I'm using to run the program is the following:
#!/bin/sh
#PBS -d /home/bellman/
#PBS -N output
#PBS -k oe
#PBS -j oe
#PBS -l nodes=2:ppn=8,walltime=10000:00:00
#PBS -V
ulimit -s 536870912
# How many procs do I have?
NP=$(wc -l $PBS_NODEFILE | awk '{print $1}')
echo Number of processors is $NP
mpiexec -np 16 /home/bellman/AAA
I tried lots of combinations of nodes and ppn, but one of the two errors happen. Any ideas on what is going on?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
你试过了吗 :
Did you try :