当前位置：文江博客话题详情

slurm partition

SLRUM：当节点位于2个分区时，如何限制一个分区中特定节点的CPU数量？

发布于 2025-01-21 02:32:51 字数 517 浏览 5 评论 0原文

事实上，我发现了一个与我非常相似的问题。唯一的区别是我的小集群中节点的CPU数量不同。（类似的问题是这里）

例如，我的集群中的节点是：

node1，36个CPU
Node2，32个CPU
Node3，24个CPU + 1个GPU
Node4，16个CPU + 1 GPU

我有2个分区：cpu（所有节点）和gpu（node3,4）。

如何在node3和node4中保留4个CPU用于gpu分区？换句话说，如何配置使cpu分区包含node1和node2中的所有CPU，node3中的20个CPU和node4中的12个CPU？

（参数MaxCPUsPerNode不能满足我的需求。）

谢谢！

收藏 0

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

评论（2）

家住魔仙堡 2025-01-28 02:32:51

使用消耗性可跟踪资源插件 (https://slurm.schedmd.com/cons_res.html ）而不是默认的节点分配插件，您可以将 DefCpuPerGPU 设置为 4（请参阅有关设置此变量并在您的slurm.conf 文档位于：https://slurm.schedmd.com /cons_res.html#using_cons_tres）

回复收藏 0 原文

素染倾城色 2025-01-28 02:32:51

我找到了有点笨拙的解决方案，但确实可以完成工作。我有一个群集，其节点具有不同的CPU。我需要一个可以使用大多数节点中的所有CPU，但只能使用另一个节点的CPU子集。据我所知，这种特定的描述是不可能用Slurm来完成的。

但是，如果我创建两个分区：

mostnodes ，带有nodes = n1，n2，n3，n3，n4
limited node ，带有nodes = n5 maxcpuspernode = 15

，然后用- partition = mostnodes，limitedNode提交作业，调度程序将首先在任何分区上安排作业。用 manpage ：

如果作业可以使用多个分区，请在
逗号单独的列表，最早的发行仪式将是
不用考虑分区名称排序（尽管
更高的优先级分区将首先考虑）。当工作是
启动，使用的分区名称将首先放在
作业记录分区字符串。

这不是一个完美的解决方案，但据我所知，这是目前可用的最佳解决方案。

回复收藏 0 原文

~没有更多了~

关于作者

暂无简介

文章

评论

28 人气

关注发私信

相关话题

热门标签

操作系统程序设计 IT运维 Linux系统管理 JavaScript 服务器应用 solaris C/C++ PHP Shell BSD Vue.js aix Oracle Python HTML 系统管理 HTML5 CSS 前端

推荐作者

十二

文章 0 评论 0

飞烟轻若梦

文章 0 评论 0

OPleyuhuo

文章 0 评论 0

wxb0109

文章 0 评论 0

旧城空念

文章 0 评论 0

-小熊_

文章 0 评论 0

友情链接

我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的隐私政策了解更多相关信息。单击 接受 或继续使用网站，即表示您同意使用 Cookies 和您的相关数据。

原文