我有一个关于Couchbase(3.1)的RAZ +Replica+ autoFailover行为的问题。
我想模拟下面的配置和灾难场景:
VMWare VCenter提供的vm平台上有2个节点(模拟couchbase集群的第一部分成员来自初级生产区)。RHEV (基于KVM)提供的vm平台上有3个节点(模拟couchbase集群的第2部分成员来自同一数据中心的次级产品区域)。
这5个节点都安装了相同的操作系统和相同版本的couchbase(3.1)位。并在第一轮测试中将其配置为一个集群,并创建了一个存储桶,并将replica=2更改为3。启用“自动故障转移”设置。
假设在二次生产区(由RHEV平台提供)的三个节点同时崩溃(模拟次级区域完全失败,例如。整个RHEV平台因停电而坠毁)。
减少对集群可用性的伤害和减少对连接/操作couchbase集群的应用程序的影响的最佳方法是什么(r/w操作)。
什么是最好的组合,充分利用Rack意识,微调副本号码和正确的操作步骤,这三个节点崩溃的场景?
顺便说一句:假设在执行故障转移(或autoFailover)时没有容量/负载问题,也就是级联故障。
谢谢
发布于 2015-09-21 04:10:23
如果您要在您讨论的两个Hypervisors中使用RZA,我将使用偶数。每个HV上有3个节点,HV #1上的所有节点都在服务器组#1中,HV #2上的所有节点都在服务器组#2中。对于您提到的失败场景,当整个HV崩溃时,拥有多个副本对您一点帮助都没有。在使用RZA运行时,正如我前面提到的,SG#1中的节点的所有副本都在SG#2中的节点上结束,反之亦然。希望这是有意义的。
另外,我们正在讨论的配置中的RZA是生产中的企业专用特性,因此这意味着您已经为此付出了代价(生产中的任何两个以上节点都必须获得许可)。我只提到,因为这类事情可以带到您的Couchbase帐户经理或技术支持团队,以获得这个和其他更详细的帮助。
https://stackoverflow.com/questions/32683237
复制相似问题