我试图在datastax企业集群中设置hadoop节点和cassandra节点。在这一点上,有两件事我不清楚。第一,我需要多少hadoop节点?卡桑德拉节点的数目相同吗?这些数据还存在于卡桑德拉节点上吗?第二,教程提到我应该在hadoop节点上禁用nodes。我还可以在集群中的cassandra节点上使用nodes吗?谢谢。
发布于 2014-11-21 14:16:26
在中,您可以在运行Cassandra的节点上运行Hadoop。最常见的部署是使两个数据中心(节点的逻辑分组)。一个数据中心专门用于分析,并包含同时运行Hadoop和C*的计算机,而另一个数据中心仅为C*,并为集群的OLTP功能提供服务器。Analytics节点上的C*进程连接到集群的其余部分(与任何其他C*节点一样),并在编写突变时接收更新,因此最终与数据库的其余部分保持一致。数据既存在于这些节点上,也存在于集群中的其他节点上。同样,大多数人最终都会使用NetworkTopologyStrategy创建一个复制模式,它只在C*中指定几个副本,在分析DC中指定一个副本,但您的使用程序可能有所不同。两个数据中心中的节点数目不必相等。
对于第二个问题,是的,您可以在C*专用数据中心中启用Vnodes。此外,如果批处理作业显着地足够大,则还可以在分析数据肠中运行vnodes,而性能只受到轻微的影响。同样,这完全基于您的用例。如果您想要更快、更短的分析作业,则不希望在分析数据中心中启用vnodes。
https://stackoverflow.com/questions/27054193
复制相似问题