我有一个特殊的要求,我必须将部分表的数据导出到另一个Cassandra数据库。两台服务器位于不同国家的不同数据中心。
导出表的结构与原表相同,只有新的数据库是旧的数据库的子集。
例如,表有3列user、cxtId、cxt,user,cxtId是主键。
在一般情况下,我会有一个有很多cxtId用户。假设我现在在db中有10个用户数据,但我只想将其中3个导出到新的db中,目标可能有一些具有相同主键的数据,并且我想覆盖这些数据。
我如何在Cassandra中做到这一点。
我已经检查了复制命令,但它似乎支持完整的数据集(可能包含部分列)。
有没有好的方法来解决我的问题?谢谢。
埃里克
发布于 2018-11-08 16:30:21
最后,我发现GitHub的一个工具可以解决我的问题。https://github.com/gianlucaborello/cassandradump
我可以使用这个python脚本转储选定的结果,并使用cqlsh -f将数据加载回Cassandra。
发布于 2018-11-08 18:34:38
我在我的项目中使用了一个库,它帮助我将大量数据从一个表转换到另一个表。
我想你可以从这里探索这个图书馆..https://github.com/brianmhess/cassandra-loader
您可以卸载数据,根据需要进行操作,然后将数据加载到新表中。
https://stackoverflow.com/questions/53164674
复制相似问题