首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >4节点卡桑德拉-跳过冗余?

4节点卡桑德拉-跳过冗余?
EN

Server Fault用户
提问于 2015-02-15 16:28:43
回答 1查看 1.4K关注 0票数 1

经过多次恳求和案例建设,我的小组获得了购买4个节点的预算,并启动了cassandra集群。每台机器都有3x1Tb驱动器,所以我想知道跳过1路冗余和镜像数据驱动器(S)是否合理。

数据将被备份,所以这不是一个问题。

似乎在如此小的分组中丢失一台机器的可能性很低。

这是合理的,还是我遗漏了更大的问题/因素?

EN

回答 1

Server Fault用户

回答已采纳

发布于 2015-02-15 17:08:44

这真的取决于你在用卡桑德拉做什么。您是将其用于数据的可用性、数据分区,还是两者兼而有之?从这听起来,您将更多地使用它来划分您的数据,这样您就可以扩展您的数据。

您希望在cassandra中复制数据的部分原因是为了可用性。例如,如果您有一个4节点集群,复制因子为3,那么您可以在失去一个节点的情况下存活下来,而无需进行任何维护(具有仲裁一致性级别,有2个节点具有“一个”一致性级别)。另一方面,您的每个节点将保存集群上75%的数据,这可能是您希望避免的。这就是为什么我会尝试为另外一两台服务器辩护,尽管您可能不需要它,而且随着数据需要的增加,您可以添加更多的服务器。

虽然您提到丢失一台机器是不可能的,但在我看来,以1的复制因子运行是自找麻烦。你可能永远不会遇到问题,但当你遇到问题时,就不会有乐趣了。如果您使用1台巨型服务器为您的数据库提供服务,那么它就不太可能出现故障,而不是4台服务器中的1台吗?

还有其他一些因素可能导致cassandra节点失败或失去响应(操作系统故障、垃圾收集、网络问题等)。

当您开始使用分布式数据库时,与使用传统的单一数据库设置相比,容错应该成为更多关注的问题,cassandra在这方面的重点和优势在于此。

我有过去的经验,很难证明硬件购买和环境配置与管理。要让他们理解其中的含义,最好的方法是勾勒出一个失败场景,以及它是否可以接受,例如:

如果一台服务器出现硬件故障,数据损坏,卡桑德拉崩溃,我们能容忍多长时间的停机?

如果答案是'0分钟‘,您将需要使用至少3的复制因子。这也有更多的好处。当复制因子为3时,这意味着更多的节点可以为单个读取请求提供服务,从而提高读取性能。

此外,对于您的数据,镜像/RAID 1被认为是一种反模式(虽然对于提交日志来说并不是个坏主意)。最好使用RAID 0或多个数据目录,将复制因子设置为3,让cassandra为您处理冗余。

票数 2
EN
页面原文内容由Server Fault提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://serverfault.com/questions/667828

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档