python程序在没有信息的情况下在pbs中被杀死

发布于 2024-11-27 22:18:04 字数 311 浏览 3 评论 0原文

我正在 pbs_torque 管理的集群中使用 rpy2 运行一个简单的 Python 程序。我的问题是,同一段代码可以完美地工作,而其他时候则在没有逻辑原因或错误跟踪的情况下被杀死。在程序执行期间的随机点,执行结束。我得到的唯一输出错误是:

kill: 20: 没有这样的进程

我不需要提及,我不会打印该消息。某些输出错误文件甚至多次包含此消息。我已经进行了一些搜索,但没有找到任何相关的帮助。集群的所有节点都具有相同的配置,并且应该为每个核心运行一个程序实例。

欢迎提出建议。

谢谢

I'm running a simple Python program using rpy2 in a cluster managed by pbs_torque. My problem is that the same piece of code works perfectly and other times is killed without logical reason or error trace. At random points during the execution of the program, the execution finishes. The only output error I get is this:

kill: 20: No such process

I do not need to mention, that I'm not printing that message. Some output error files even contain this message several times. I've done some search but I have not found any relevant help. All the nodes of the cluster have the same configuration, and are supposed to run one instance of the program per core.

Suggestions are welcome.

Thanks

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。
列表为空,暂无数据
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文