RedHat 5中配置RHCS遇到的几个问题
两台节点 DB1-192.168.0.238,DB2-192.168.0.239 配置RHCS,浮动IP资源:192.168.0.240,共享磁盘资源:/dev/sdb1 挂载在/share目录(两台节点都有),因为没有硬件fencing设备,我就设置的是手动fencing,service名称是DB_service
然后启动2台节点,集群资源在DB2上,然后我想试试看停止DB2的cman服务,集群资源是否会漂到DB1节点上
在DB2上 service rgmanager stop,service cman stop,然后查看系统日志,rgmanager停止失败,信息如下
[root@DB2 share]# service rgmanager stop
Shutting down Cluster Service Manager...
Waiting for services to stop: [ OK ]
Cluster Service Manager is stopped.
[root@DB2 share]# service cman stop
Stopping cluster:
Stopping fencing... done
Stopping cman... failed
/usr/sbin/cman_tool: Error leaving cluster: Device or resource busy
[FAILED]
[root@DB2 share]# service cman status
cman is running.
[root@DB2 share]# service rgmanager status
clurgmgrd is stopped
系统日志:
Apr 22 02:40:35 DB2 clurgmgrd[8530]: <notice> Stopping service serviceB_service
Apr 22 02:40:45 DB2 clurgmgrd: [8530]: <err> 'umount /share' failed, error=0
Apr 22 02:40:45 DB2 clurgmgrd[8530]: <notice> stop on fs "DB_fs" returned 2 (invalid argument(s))
Apr 22 02:40:55 DB2 clurgmgrd[8530]: <crit> #12: RG serviceB_service failed to stop; intervention required
Apr 22 02:40:55 DB2 clurgmgrd[8530]: <notice> Service serviceB_service is failed
Apr 22 02:40:55 DB2 clurgmgrd[8530]: <notice> Shutdown complete, exiting
Apr 22 02:40:56 DB2 rgmanager: [21503]: <notice> Cluster Service Manager is stopped.
停止cman的时候 提示设备或资源正忙,我想问的是 怎么知道这个集群的资源正在被什么进程所使用呢?
然后在DB1节点上,用clustat看集群的状态,信息如下
[root@DB1 db2inst1]# clustat
Cluster Status for cluster @ Fri Apr 22 02:27:18 2011
Member Status: Quorate
Member Name ID Status
------ ---- ---- ------
DB1 1 Online, Local, rgmanager
DB2 2 Online
Service Name Owner (Last) State
------- ---- ----- ------ -----
serviceB_service (DB2) failed
显示集群Service被DB2拥有,但是状态是失败,而这些集群资源也没漂到DB1上
所以 我想请问大家,在DB2节点上停止cman的时候报的错误:设备或资源正忙,这个怎么来看系统里哪些进程在使用这些资源?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(2)
这么多人看 却没人回复啊
!!!!!!!!!!!!
cman服务的停止和集群服务的资源没有直接关系。不会因为rgmanager在运行而导致cman关闭不了。
你的问题如果不是出现在配置方面,那么主要还是在于集群基础架构方面。
cman因为某种原因不能正常退出cluster domain,而且一般我们也不会采用这种方法去关停cman服务。