批处理作业调度的替代方案（在计算池中）

发布于 2025-01-02 19:13:05 字数 186 浏览 1 评论 0原文

由于我没有计算池中计算机的 root 权限，因此无法调整 atd 的负载参数以进行批处理，因此我正在寻找一种替代方法来进行作业调度。由于机器是由多个用户使用的，因此应该能够考虑到负载。或者，我正在寻找一种方法来为池中的所有机器执行此操作，即，有一个包含需要运行的作业的中央队列，以及一个将它们（通过 ssh）分发到下面的机器上的脚本一定的负载。有什么想法吗？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

苍风燃霜 2025-01-09 19:13:05

首先：与计算池的系统管理员交谈。如今，企业范围的作业调度程序已成为基础设施中相当常见的组件。通常，这些调度程序不会考虑系统负载。

如果上述方法没有带来好的解决方案，您应该仔细考虑您的作业会给计算机带来什么负载：您的作业可能会给 CPU 带来更大的压力，消耗大量内存，生成大量网络或磁盘 IO 活动。因此，确定您的作业是否应该开始可能取决于很多测量，其中一些测量您作为普通用户无法完成（在一定程度上取决于您运行的操作系统类型以及安全性有多严格）。无论如何：您只能考虑作业启动时的负载。显然，如果每个用户都这样做，那么您很快就会回到原点...

最好与您的系统管理员一起了解他们是否有某种资源控制（例如 Solaris 中的项目）通过它，他们可以确保您的批次不会破坏计算池中的节点。接下来，以能够应对操作系统拒绝资源请求的方式编写批处理作业。

编辑：至于分布式性质：对作业进行排队并使所有节点上的客户端都指向同一个队列，在资源控制的上下文中尽可能多地消耗......

回复收藏 0 原文

~没有更多了~