我正在为高可用性与一个2节点集群(这里称为A和B的节点)与Pac怪人和Stonith合作。两个节点都有一个IPMI作为隔离设备。
协议是:
然后我插入A节点的电源。所以A上的每个eth接口和IPMI都是不可用的。这里有一个窍门:B试图成功地将A降下来,因为A的IPMI是无法到达的。当N次尝试完成时,B放弃并使自己进入“块”状态(在日志文件中称为空闲)。
我的问题是:即使Stonith A失败了,我怎么能强迫B收回资源呢?
我理解结果(并发写入等),但是我比较喜欢这些结果,而不是根本无法获得的服务。
发布于 2015-06-24 19:40:00
您已经描述了这个问题:
B试图将A降下来,因为A的IPMI是无法到达的。
除非B能完成一次成功的栅栏操作,否则它将被挂起来,以避免出现分裂大脑的情况.您可以通过配置辅助围栏机制来减轻这一问题。
https://serverfault.com/questions/701354
复制相似问题