我有一个关于这个连接器的问题。如果我的Spark集群和我的Cassandra集群不在同一个集群上,那么读取是如何工作的呢?Spark是否将整个Cassandra表放入自己的集群中,并将其重新排列到Spark分区中?
发布于 2017-02-17 02:27:55
push down operations在spark和cassandra之间是可用的,只要你及早过滤,卡桑德拉会进行所有过滤,这样你就可以通过网络发送已经过滤的数据,请阅读:tips cassandra-spark
https://stackoverflow.com/questions/42279678
复制相似问题