{已解决}想问个lustre1.6.6的手动failover的问题
我是这样配置的:
两个MDS1 2.挂了共享存储的
[root@mds1 ~]# mkfs.lustre --fsname=testfs --mdt --mgs --failnode=mds2 /dev/sdb
[root@mds1 ~]# mkdir -p /mnt/mdt
[root@mds1 ~]# mount -t lustre /dev/sdb /mnt/mdt
[root@mds2 ~]# mkdir -p /mnt/mdt
[root@mds2 ~]# mount -t lustre /dev/sdb /mnt/mdt
两个OSS1 2 挂了共享存储的
[root@oss1 ~]mkfs.lustre --fsname=testfs --ost --failnode=oss2 --mgsnode=mds1 --mgsnode=mds2 /dev/sdb
[root@oss1 ~]# mkdir -p /mnt/ost
[root@oss1 ~]# mount -t lustre /dev/sdb /mnt/ost
[root@oss2 ~]# mkdir -p /mnt/ost
[root@oss2 ~]# mount -t lustre /dev/sdb /mnt/ost
两个OSS3 4 挂了共享存储
[root@oss3 ~]mkfs.lustre --fsname=testfs --ost --failnode=oss4 --mgsnode=mds1 --mgsnode=mds2 /dev/sdb
[root@oss3 ~]# mkdir -p /mnt/ost
[root@oss3 ~]# mount -t lustre /dev/sdb /mnt/ost
[root@oss4 ~]# mkdir -p /mnt/ost
[root@oss4 ~]# mount -t lustre /dev/sdb /mnt/ost
[root@client1 ~]#mkdir /lustre
[root@client1 ~]#mount -t lustre md1:md2:/testfs /lustre
[root@client2 ~]#mkdir /lustre
[root@client2 ~]#mount -t lustre md1:md2:/testfs /lustre
一切完成后我测试 关掉mds1就不能工作了.为什么?关掉mds2一切都是很正常.
然后看了手册.知道了lustre提供failover但是不提供其他的检测.要实现真正的HA只有靠第三方的东西.但是我看了下手册上后面的failover章节.它用的heartbeatv1 v2都做了failover但是都是做的ipfail
我想问下熟悉lustre的朋友.在这里如果mds1挂掉了.我还有mds2存在.能不能手工用什么命令切换.由于手册太长.英文又比较烂.我想应该是可以手工切换的.谢谢.
[ 本帖最后由 chuanqimaster 于 2008-12-18 16:44 编辑 ]
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(2)
要切换。只是时间很长。我的虚拟机5分钟。搞定了
可以设置超时的吧