到目前为止,我已经完成了Cassandra中的数据分区,并找到了一些基本的处理方法,比如,如果您有6个节点,每个节点位于两个独立的数据中心,那么我们有以下数据复制方法:
数据复制是通过解析节点来实现的,直到Cassandra遇到属于另一个数据中心的节点并将副本放置在那里,重复这个过程,直到所有数据中心都有一个节点的副本--按照NetworkTopologyStrategy。
因此,我们有两个副本的整个数据,其中一个在每个数据中心。但是,如果我想根据业务或地理位置这样的属性逻辑地将数据分割成两个单独的块(印度的数据DataCenter),该怎么办?因此,我们将在一个地理位置的数据中心中获得一大块数据,而在另一个位置上,数据中心中的数据块没有一个重叠。
那有可能吗?考虑到卡桑德拉和大数据在总体上的应用,这有意义吗?
发布于 2014-09-09 16:08:47
地理切分当然是可能的。您只需运行多个没有连接的数据中心,它们就不会复制。或者,你可以让他们复制,但你的印度应用程序只读写你的印度DC。这是否合理取决于您的应用程序。
https://stackoverflow.com/questions/25746478
复制相似问题