我正在寻找一个优雅的解决方案在Cassandra数据库中的数据聚合。(问题就像在Cassandra中运行group by查询一样简单)
在我们的应用程序中,我们将客户登录历史记录存储在一个cassandra表中(为了获得更快的写入速度和更高的TPS支持的明显好处),目前我们应该在此数据之上开发一个分析仪表板。对于这个需求,数据聚合是必要的,这在Cassandra中是不直接可用的。
我们已经评估了在Cassandra之上使用Apache Solr的选项。有两种方法:使用Solandra或使用DataStax。Solandra项目不再处于开发阶段,不能用于生产环境。Datastax EE不是免费的(只会作为最后一个选项)。
如果我们的问题有更简单、更优雅的解决方案,请告诉我们。
提前谢谢。
发布于 2015-01-09 18:47:06
使用Apache Spark,以及DataStax Spark Cassandra连接器。如果您在cassandra节点上运行Spark workers,您甚至可以获得位置感知。Spark几乎正在成为Cassandra分析的事实。
https://stackoverflow.com/questions/27858676
复制相似问题