使用 qsub/torque 提交作业时排除某些节点?
使用 qsub 提交批处理作业时,有没有办法排除某个节点(按主机名)? 像这样的东西 # this is just a pseudo command: qsub myscript.sh --exclude co…
我可以在使用 qsub 提交 shell 脚本后删除它而不影响作业吗?
我想使用 qsub 提交一堆作业 - 这些作业都非常相似。我有一个带有循环的脚本,在每个实例中它都会重写文件 tmpjob.sh ,然后执行 qsub tmpjob.sh 。在…
将 qsub (sge) 与多线程应用程序结合使用
我想向我正在使用的集群网络提交一个多线程作业 - 但是关于 qsub 的手册页并不清楚这是如何完成的 - 默认情况下,我猜它只是将其作为正常作业发送,而…
如何设置 qsub 在 job1 完成后五秒(或任何所需的值)运行 job2?
目前我所做的是估计 job1 何时完成,然后使用“#PBS -a [myEstimatedTime+5]”指令为 job2 运行 qsub。但我对我的方法不满意,因为有时它会超过/低于…
python程序在没有信息的情况下在pbs中被杀死
我正在 pbs_torque 管理的集群中使用 rpy2 运行一个简单的 Python 程序。我的问题是,同一段代码可以完美地工作,而其他时候则在没有逻辑原因或错误跟…
将 Perl 生成的脚本提交到 SGE 时捕获作业 ID
Perl 无法打开同时运行的命令管道,这会导致通过 qsub 提交到 SGE 时出现问题,因为我丢失了提交的作业 ID。如何将生成的脚本提交给 SGE 并捕获 SGE …
SGE - QSUB 无法在同步模式下提交作业
我有一个 perl 脚本,它准备文件以输入到二进制程序,并将二进制程序的执行提交到 SGE 排队系统版本 6.2u2。 使用 -sync y 选项提交作业,以允许父 Pe…
在 GridEngine 集群的多个节点上运行作业
我可以访问一个 128 核集群,我想在该集群上运行并行作业。该集群使用 Sun GridEngine,我的程序编写为在 Python 2.5.8 上使用并行 Python、numpy、sc…
以 qsub 启动的 shell 脚本的参数
如何参数化在网格上执行的 shell 脚本(以 qsub 开头)?我有一个 shell 脚本,我使用 getopts 来读取参数。 当我使用 qsub 启动 (qsub script.sh -r …
“令人尴尬地平行”在集群上使用 python 和 PBS 进行编程
我有一个可以生成数字的函数(神经网络模型)。我希望在带有 Torque 的标准集群上使用 PBS 来测试来自 python 的多个参数、方法和不同输入(意味着数…
从 Sun Grid Engine 上使用 qsub 提交的进程获取退出代码
我想通过 Sun Grid Engine(现在:Oracle Grid Engine?)上的 qsub 提交作业。我不想使用 -sync yes 选项或 qrsh,因为我希望我的控制程序是单线程的…
有人有在 ClusterVisionOS 上运行集群的经验吗?
我目前正在使用 ClusterVisionOS 3.1 开发集群。这将是我第一次使用集群,所以我可能还没有尝试过“显而易见的”。 我可以使用“qsub”命令向集群提交…
如何限制同时运行的 PBS 作业的数量
我有一个 64 节点集群,运行 PBS Pro。如果我提交数百个作业,我可以同时运行 64 个作业。这很棒,除非所有 64 个作业恰好都接近 I/O 限制,并且正在…