gfs系统的奇怪问题
环境:2台redhat 4 u3 的server,安装redhat cs 和gfs。
配置:lock机制是DLM,因为是测试环境,所以没有用fence设备。
症状:当两台机器都shutdown后,如果只是起一台,它会在启动到cman的时候就启动不下去了。如果这时启动第二台机器,那么过一会儿,第一台机器就可以启动cman成功,最后两台机器都可以成功启动,并且gfs服务也正常。也就是说,如果只启动一台机器,是不行的,那么如果我有一台机器硬件坏了,岂不是要等坏的机器修好了之后原来正常的机器才有的用,好像不太合理啊。这正常么?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(6)
oncity,谢谢你。
但是我在3台的情况下也是一样,如果3台down掉,只启动1台是起不起来的,也是在启动到cman服务的时候hang住。
2节点的集群比较特别,因为DLM仲裁投票问题比较头疼,是不是应该在cluster.conf加上一行
<cman expected_votes="1" two_node="1"/>
我对CS、GFS也是刚刚入门,希望不要误导LZ
道理不难,举个例子,3台机做群集,如果一台机没有响应,另外两台可以投票确认那一台死机了(或断网)
但如果两台机的情况,一台断了,另一台并不能真正决定是不是另一台死了(因为可能是他自已断网)
这种情况下,停止服务,是最安全的做法。所以架GFS,真正使用的机器要一定数量才有意义。
我的问题是为什么cman要和其他机器通信成功才可以启动?
suran007 ,成员有限制那是在使用GULM LOCK机制的情况下吧?
gfs 集群成员数目有严格的限制,少于规定的数量就会crash,不是你想要几个就几个