我在dc-1中有一个cassandra集群,现在我已经将我的集群扩展到dc-2,并扩展了所有密钥空间,然后运行
nodetool rebuild dc-1
在dc-2的所有节点上。现在有没有一种方法可以验证dc-1中的所有数据是否都复制到了dc-2中?
我使用的是cassandra的3.11.x版本
发布于 2020-05-16 17:01:05
如果您的应用程序不断地将数据写入Cassandra数据库,则很难做到这一点,因为两个数据中心的数据总是会有细微的差异,这些差异是由传输中的数据引起的。
从理论上讲,您可以使用Spark,通过自定义选项指向特定的数据中心,并拥有一个查询,该查询将加载数据直到某个特定的时间戳(基于数据库本身的数据,因此仅限于具有此类字段的表),然后比较两个数据帧。
但坦率地说,复制是Cassandra的主要功能,如果您定期执行修复(推荐使用Reaper),那么您应该同步数据。
https://stackoverflow.com/questions/61833744
复制相似问题