如题!要求基于MPI的,源代码也可以!
原帖由 coocal 于 2006-5-27 13:41 发表就是说,hpc cluster(除mosix)只能通过policy实现静态的load balance而不能通过进程迁移实现动态的load balance
load balance 本来就不是beowulf 类集群的设计方向,也就不存在你说的进程迁移实现动态load balance了.
beowulf集群的目的就是把原来大型的计算系统用廉价的扩充性好的标准计算系统组成,这些作为compute node的计算系统,就是为了满足一个大型计算任务的某个子处理了,而进程迁移本质上是和这种目标背离的.
比如一个做导弹空气动力学计算的任务,需要把对象的外表在一定的条件下的外流运动和力学结果都计算出来,就是要求榨取每个compute node上的计算能力,当问题分解下去后,每个compute node务必做到全力以赴启动计算进程在尽可能的短的时间内计算出结果,并保证和其他node的结果的汇总。如果这个时候还要求compute node的进程迁移,就会和计算要求背离.
Mosix 集群不能算是hpc 集群, mosix 集群的扩展(scale)并不能带来整体集群计算能力的增长,所以用Mosix 集群来做hpc 计算是不太妥当的,mosix, openmosix的邮件列表你可以看看,有很丰富的关于这个话题的讨论,mosix 上再跑MPI也是可能的,不过好像效果不怎么地。Mosix 类型的集群适合做rendering farm, 或者是audio/video encoding/decoding cluster, 几年前我的一个朋友用4 node mosix 来压一大批音频数据,据说效果不错.实际上dreamworks用的CCD已经包含了类似mosix 的loadbalance的redering farm system, 现在科幻片呢么多,数字电影电视都已经是主流了,商业的rendering farm 性能非常好,很多产品的结构和mosix 很像.
就是说,hpc cluster(除mosix)只能通过policy实现静态的load balance而不能通过进程迁移实现动态的load balance
原帖由 coocal 于 2006-5-24 12:32 发表我是想知道job scheduler有没有达到 load balance 的效果。
mpi based的hpc cluster, load balance 的概念和lvs之类的第三层的load balance根本是两码事.
除了mosix 之外, beowulf cluster目前都是做到 job 的load balance ,因为在hpc cluster环境,很难做到,也没有必要做到 node 之间的类似普通LB那样的效果.
job scheduler 可以通过设定job policy实现分发job到node的load balance.
我是想知道job scheduler有没有达到 load balance 的效果。
我不明白为什么hpc要测试"各"节点的load balance? 难道这些不应该是在 job scheduler上完成的么? 不理解.
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
暂无简介
文章 0 评论 0
接受
发布评论
评论(5)
load balance 本来就不是beowulf 类集群的设计方向,也就不存在你说的进程迁移实现动态load balance了.
beowulf集群的目的就是把原来大型的计算系统用廉价的扩充性好的标准计算系统组成,这些作为compute node的计算系统,就是为了满足一个大型计算任务的某个子处理了,而进程迁移本质上是和这种目标背离的.
比如一个做导弹空气动力学计算的任务,需要把对象的外表在一定的条件下的外流运动和力学结果都计算出来,就是要求榨取每个compute node上的计算能力,当问题分解下去后,每个compute node务必做到全力以赴启动计算进程在尽可能的短的时间内计算出结果,并保证和其他node的结果的汇总。如果这个时候还要求compute node的进程迁移,就会和计算要求背离.
Mosix 集群不能算是hpc 集群, mosix 集群的扩展(scale)并不能带来整体集群计算能力的增长,所以用Mosix 集群来做hpc 计算是不太妥当的,mosix, openmosix的邮件列表你可以看看,有很丰富的关于这个话题的讨论,mosix 上再跑MPI也是可能的,不过好像效果不怎么地。Mosix 类型的集群适合做rendering farm, 或者是audio/video encoding/decoding cluster, 几年前我的一个朋友用4 node mosix 来压一大批音频数据,据说效果不错.
实际上dreamworks用的CCD已经包含了类似mosix 的loadbalance的redering farm system, 现在科幻片呢么多,数字电影电视都已经是主流了,商业的rendering farm 性能非常好,很多产品的结构和mosix 很像.
就是说,hpc cluster(除mosix)只能通过policy实现静态的load balance而不能通过进程迁移实现动态的load balance
mpi based的hpc cluster, load balance 的概念和lvs之类的第三层的load balance根本是两码事.
除了mosix 之外, beowulf cluster目前都是做到 job 的load balance ,因为在hpc cluster环境,很难做到,也没有必要做到 node 之间的类似普通LB那样的效果.
job scheduler 可以通过设定job policy实现分发job到node的load balance.
我是想知道job scheduler有没有达到 load balance 的效果。
我不明白为什么hpc要测试"各"节点的load balance? 难道这些不应该是在 job scheduler上完成的么? 不理解.