我们有一个五个节点的Riak集群(n_val是3),运行在跨多个可用区域的亚马逊EC2上。因为我们没有企业版,所以我们没有多个数据中心复制和完全同步到不同区域/区域的奢侈。
我们目前的备份策略是:
riak stop的riak服务(因为我们使用leveldb后端)riak start启动riak服务我已经在一个3节点测试集群上测试了这种方法,该集群没有太多的活动,并且从快照中恢复,没有任何问题。我想从这里的专家那里了解这种方法是否适用于具有大量活动的生产集群。在关闭节点和重新启动节点期间,我们会遇到任何与切换相关的问题吗?还有什么是我目前不知道的,当灾难发生时,可能会阻碍恢复的机会?
提前感谢!
发布于 2015-03-06 09:46:14
备份文件指出:
可以使用操作系统特性或支持快照的文件系统(如LVM或ZFS )或使用rsync或tar等工具来执行Riak备份。
我从未使用过EBS快照,但我确信它可以被视为“支持快照的文件系统”。
因此,只要在备份节点之前关闭每个节点,就应该做得很好。
关于切换:我建议在备份节点A之后,在备份下一个节点B之前,等待所有创建的切换(因为A被关闭)被转移到A。
注意不要将所有单个节点的备份视为“整个集群的备份”。每个节点将被单独备份。如果您的集群处于沉重的写负载之下,并且等待在备份之间传输切换,那么您就不能认为您的节点备份是同时完成的。
这没什么大不了的:当您从备份中恢复一个节点时,您可以触发读取-修复,或者等待AAE为您修复数据。当您从备份中恢复节点时,您可能希望将AAE配置为更具侵略性。
https://stackoverflow.com/questions/28874340
复制相似问题