关于使用RHCS实现拔网线自动切换的问题
环境为两台redhat as3(未打任何update)+HP MSA500G2盘阵做HA,安装了clumanager 1.2.3-1,添加service ip时也已经选上了monitor link,但是拔掉当前active结点的网线时无法实现自动切换。但是如果关闭当前active结点资源是可以实现切换的。
谢谢各位大哥指教了
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(9)
rawdevice在 v3当中是用来做quorum仲裁关系的,用来每个确定集群成员各自组成集群的投票关系. fence是当你的集群出现brain-split之后,为了在不知道其他成员节点状态的情况下,采用STONITH的方式把对方成员干掉,让其彻底脱离集群的共享存储和其他资源组,从而保护集群的某节点(通常是主节点)能够完整不受破坏和干扰的访问共享资源.
你看 v3 guide的 fence章节,提到了一些fence的配置,v4里面可以采用好几种fence, 如果没有fence,你就得manual fence.
你注意到前面我帖子里面引用的你的log file么?
集群在监测到你的某个float IP指向的LAN eth 废掉之后,马上开始要对你的对方节点 STONITH乐,也就是准备要进行一系列的fence操作来干掉它.
[ 本帖最后由 nntp 于 2006-8-17 09:02 编辑 ]
fence的主要用途是保护共享盘阵上的数据的一致性,也就是防止brain-split,是这样理解吗?我是在盘阵上做了rawdevice仲裁来防止这种情况的出现。这样算不算是在这个HA中没有配置fence呢?
redhat cluster suite 3中提到了如果有使用了power switchs时可以使用clufence命令,但是我没有power switchs,是不是就没法做fence了呢?
你fence 用了什么?
Aug 15 12:30:14 nw1 cluquorumd[14583]: <warning> --> Commencing STONITH <--
Shoot
The
Other
Node
In
The
Head
<?xml version="1.0"?>
<cluconfig version="3.0">
<clumembd broadcast="yes" interval="750000" loglevel="5" multicast="no" multicast_ipaddress="" thread="yes" tko_count="20"/>
<cluquorumd loglevel="5" pinginterval="" tiebreaker_ip=""/>
<clurmtabd loglevel="5" pollinterval="4"/>
<clusvcmgrd loglevel="5"/>
<clulockd loglevel="5"/>
<cluster config_viewnumber="8" key="a3630e768c7ff7028df21e997677caf5" name="test"/>
<sharedstate driver="libsharedraw.so" rawprimary="/dev/raw/raw1" rawshadow="/dev/raw/raw2" type="raw"/>
<members>
<member id="0" name="10.115.5.21" watchdog="yes">
</member>
<member id="1" name="10.115.5.22" watchdog="yes"/>
</members>
<services>
<service checkinterval="10" failoverdomain="None" id="0" name="oracle" userscript="/home/oracle.sh">
<service_ipaddresses>
<service_ipaddress broadcast="None" id="0" ipaddress="10.115.5.23" monitor_link="1" netmask="255.255.255.0"/>
</service_ipaddresses>
<device id="0" name="/dev/cciss/c1d1p1" sharename="">
<mount forceunmount="yes" fstype="ext3" mountpoint="/oracle" options="rw"/>
</device>
</service>
</services>
<failoverdomains/>
</cluconfig>
pls 贴config出来.
nntp老大,您终于出现了,天空一片光芒啊~~~
我很仔细的照看了两遍红帽的官方文档,monitor link选项也选上的,所以我就纳闷了
关闭节点切换也正常的,手动切换也正常的,请nntp老大指点啊~~
配置 service的时候, 在Add service 的时候 , 勾上 monitor Link.
手册肯定没有看吧? 嘿嘿.
[ 本帖最后由 nntp 于 2006-8-16 13:59 编辑 ]
在我拔掉当前active节点的网线后,系统报这样的错:
Aug 15 12:30:14 nw1 cluquorumd[14583]: <warning> Membership reports member #1 as DOWN, but disk reports as UP: marking as PAN
IC
Aug 15 12:30:14 nw1 cluquorumd[14583]: <warning> --> Commencing STONITH <--
Aug 15 12:30:14 nw1 clusvcmgrd[14600]: <warning> Member 10.115.5.25's state is uncertain: Some services may be unavailable!
nntp老大在吗,麻烦请指点一下迷津吧