我找到了一篇文章,其中作者建议使用next Spark架构模式(为每个Cassandra节点提供Spark):

我有N个卡桑德拉节点。所有节点都是彼此的完整副本。在我的例子中,为每个Cassandra节点运行火花奴隶是否有意义?
发布于 2016-04-11 12:47:47
是的,确实如此。连接器具有数据局部性,即每个与Cassandra节点共同定位的火花公子节点将确保只处理本地Cassandra数据,从而避免在整个网络中对大量数据进行混叠。通过观看罗素·斯皮策( Russell )关于这个主题的演讲,你可以了解它是如何工作的。
https://stackoverflow.com/questions/36546591
复制相似问题