有测试HPC集群各节点负载平衡的软件包吗

发布于 2022-07-09 15:12:54 字数 19 浏览 6 评论 5

如题!要求基于MPI的,源代码也可以!

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(5

油焖大侠 2022-07-24 00:59:33

原帖由 coocal 于 2006-5-27 13:41 发表
就是说,hpc cluster(除mosix)只能通过policy实现静态的load balance而不能通过进程迁移实现动态的load balance

load balance 本来就不是beowulf 类集群的设计方向,也就不存在你说的进程迁移实现动态load balance了.

beowulf集群的目的就是把原来大型的计算系统用廉价的扩充性好的标准计算系统组成,这些作为compute node的计算系统,就是为了满足一个大型计算任务的某个子处理了,而进程迁移本质上是和这种目标背离的.

比如一个做导弹空气动力学计算的任务,需要把对象的外表在一定的条件下的外流运动和力学结果都计算出来,就是要求榨取每个compute node上的计算能力,当问题分解下去后,每个compute node务必做到全力以赴启动计算进程在尽可能的短的时间内计算出结果,并保证和其他node的结果的汇总。如果这个时候还要求compute node的进程迁移,就会和计算要求背离.

Mosix 集群不能算是hpc 集群, mosix 集群的扩展(scale)并不能带来整体集群计算能力的增长,所以用Mosix 集群来做hpc 计算是不太妥当的,mosix, openmosix的邮件列表你可以看看,有很丰富的关于这个话题的讨论,mosix 上再跑MPI也是可能的,不过好像效果不怎么地。Mosix 类型的集群适合做rendering farm, 或者是audio/video encoding/decoding cluster, 几年前我的一个朋友用4 node mosix 来压一大批音频数据,据说效果不错.
实际上dreamworks用的CCD已经包含了类似mosix 的loadbalance的redering farm system, 现在科幻片呢么多,数字电影电视都已经是主流了,商业的rendering farm 性能非常好,很多产品的结构和mosix 很像.

假情假意假温柔 2022-07-24 00:06:30

就是说,hpc cluster(除mosix)只能通过policy实现静态的load balance而不能通过进程迁移实现动态的load balance

往日情怀 2022-07-22 06:08:06

原帖由 coocal 于 2006-5-24 12:32 发表
我是想知道job scheduler有没有达到 load balance 的效果。

mpi based的hpc cluster, load balance 的概念和lvs之类的第三层的load balance根本是两码事.

除了mosix 之外, beowulf cluster目前都是做到 job 的load balance ,因为在hpc cluster环境,很难做到,也没有必要做到 node 之间的类似普通LB那样的效果.

job scheduler 可以通过设定job policy实现分发job到node的load balance.

笑着哭最痛 2022-07-20 00:42:12

我是想知道job scheduler有没有达到 load balance 的效果。

旧梦荧光笔 2022-07-17 21:22:47

我不明白为什么hpc要测试"各"节点的load balance?  难道这些不应该是在 job scheduler上完成的么? 不理解.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文