PBS 批处理系统是否跨节点移动多个串行作业？

发布于 2024-10-27 07:28:28 字数 594 浏览 9 评论 0原文

如果我需要“并行”运行许多串行程序（因为问题很简单但耗时 - 我需要读取同一程序的许多不同数据集），如果我只使用一个节点，解决方案很简单。我所做的就是在每个命令后继续提交带有“&”号的串行作业，例如在作业脚本中：

./program1 &
./program2 &
./program3 &
./program4

这自然会在不同的处理器上运行每个串行程序。这在登录服务器或独立工作站上运行良好，当然也适用于仅需要一个节点的批处理作业。

但是，如果我需要运行同一程序的 110 个不同实例来读取 110 个不同的数据集怎么办？如果我使用提交 110 个 ./program# 命令的脚本提交到多个节点（比如 14 个），批处理系统是否会在不同节点上的不同处理器上运行每个作业，或者会尝试在同一处理器上运行它们， 8核心节点？

我尝试使用简单的 MPI 代码来读取不同的数据，但会导致各种错误，110 个进程中约有 100 个成功，其他进程崩溃。我也考虑过作业数组，但我不确定我的系统是否支持它。

我已经在各个数据集上广泛测试了串行程序 - 没有运行时错误，并且我没有超出每个节点上的可用内存。

原文

If I need to run many serial programs "in parallel" (because the problem is simple but time consuming - I need to read in many different data sets for the same program), the solution is simple if I only use one node. All I do is keep submitting serial jobs with an ampersand after each command, e.g. in the job script:

./program1 &
./program2 &
./program3 &
./program4

which will naturally run each serial program on a different processor. This works well on a login server or standalone workstation, and of course for a batch job asking for only one node.

But what if I need to run 110 different instances of the same program to read 110 different data sets? If I submit to multiple nodes (say 14) with a script which submits 110 ./program# commands, will the batch system run each job on a different processor across the different nodes, or will it try to run them all on the same, 8 core node?

I have tried to use a simple MPI code to read different data, but various errors result, with about 100 out of the 110 processes succeeding, and the others crashing. I have also considered job arrays, but I'm not sure if my system supports it.

I have tested the serial program extensively on individual data sets - there are no runtime errors, and I do not exceed the available memory on each node.

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

呆° 2024-11-03 07:28:28

不，PBS 不会自动为您在节点之间分配作业。但这是一件很常见的事情，并且您有几种选择。

最简单且在某些方面对您来说最有利的是将任务打包成 1 节点大小的块，并将这些包作为单独的作业提交。这将使您的工作更快开始； 1 节点作业通常比 14 节点作业调度得更快，只是因为调度中单节点大小的漏洞多于 14 个节点。如果所有作业花费的时间大致相同，那么这种方法效果特别好，因为这样划分就非常简单了。
如果您确实想在一项工作中完成所有工作（例如，为了简化簿记），您可能有权也可能没有访问 pbsdsh 命令；这里对此进行了很好的讨论。这使您可以在作业中的所有处理器上运行单个脚本。然后，您编写一个脚本来查询 $PBS_VNODENUM 以找出它是哪个 nnodes*ppn 作业，并运行适当的任务。
如果不是 pbsdsh，Gnu parallel 是另一个可以极大地简化这些任务的工具。如果您熟悉的话，它就像 xargs，但会并行运行命令，包括在多个节点上。因此，您可以提交（比如说）14 节点作业，并让第一个节点运行 gnu 并行脚本。好处是，即使作业的长度并不相同，这也会为您进行调度。我们给系统上的用户使用 gnu 并行处理此类事情的建议是这里。请注意，如果您的系统上没有安装 gnu parallel，并且由于某种原因您的系统管理员不会这样做，您可以在您的主目录中设置它，这不是一个复杂的构建。