<ip ref="192.168.16.93">
<fs ref="shdisk"/>
<script ref="dbscript"/>
</ip>
</service>
</rm>
</cluster>
hqonline
有了结果了
下午找了REDHAT 800,终于问出了个结果,
REDHAT的fence device有两种,内部fence设备(如IBM RSAII卡,HP的iLO卡,还有IPMI的设备等)和外部fence 设备(如UPS,SAN SWITCH,NETWORK SWITCH等)。
IXDBA.NET社区论坛
对于外部fence 设备,可以做拔电源的测试,因为备机可以接受到fence device返回的信号,备机可以正常接管服务,
对于内部fence 设备,不能做拔电源的测试,因为主机断电后,备机接受不到主板芯片做为fence device返备的信号,就不能接管服务,clustat会看到资源的属主是unknow,查看日志会看到持续报fence failed的信息。
所以以后在做项目时要分清楚,写测试报告时不要给自己下套,在内部fence时写拔电源可以切换
RHAS4+RHCS4,问个问题
aquaofchina
做双机热备,但现在没有另加fence设备,是不是只能配成手动模式啊?
还有配成其他模式,一般都需要些什么设备啊?能否介绍以下,谢谢!
hqonline
最近对fence device看了很多,只讲一下自己理解的,
如果没有fence device就只能配成manual fence,这种fence device在切换侧室时,要手动的在备机上输入fence_man_alk(好象是这个,在日志中能看到,自己确认一下)那个命令,备机才能接管资源,启动服务。
至于支持的fence设备,可以在rhcs的官方文档中看到,
还告诉大家一个消息,对于主版集成IPMI设备的机器,可以把fence device选成IPMI LAN,直接用RHAS4。4自带的IPMI服务就能驱起来,并且能工作,2台机器的IPMI网口直连,但是,如果有一台机器完全拔掉电源的话,切换就会有问题,估计是RHCS的一个问题,因为备机只有在fence命令必须等到一个成功的返回后才去接管服务,可是主机电源线都把了,不可能有回复了,结果备机就会一直显示fence failed,而不去接管服务,这是不是RHCS的一个BUG呢?
hqonline
据我理解,fence device就是起如下的作用,当意外原因导致主机的服务停止或当机时,LINUX为了保证数据的完整性,在主机的服务重起之前,由备机发出重起机器的信号,将主机机器重新启动,这个过程中,备机会接管服务。fence device就是发出这个重起信号的设备。
aquaofchina
我自己配了一个用HP-iLO实现的,感觉就是为了保证共享盘的独占,只有等到收到故障机器已经开始重启的信号,备机才开始接管服务。就是先向故障机器的iLO口发一个reboot信号,然后开始阶段性从故障机器iLO取机器状态,直到取到状态为DOWN。
ibm pc server + rhas4.4 + rhcs4.4 配置fence的方法
hqonline
这个帖子是为了答复simonocn的问题,同时给大家共享一下
ibm pc server + rhas4.4 + rhcs4.4 配置fence的方法如下:
硬件:
1、在2台服务器上,在BIOS里配置BMC的IP地址,如192.168.10.100,两台机器一样
2、把2台机器的1网口用一根直连线连起来,或接到同一交换机上或同一VLAN中,
软件:
1、在2台服务器上,配置系统中1网口对应的网卡(ethx),将IP地址配为192.168.10.101和192.168.10.102