我有一个类似于下面的Cassandra DB表:
key | name | client
1 A C1
2 B C2
3 C C1我使用Python (Pycassa)访问我的Cassandra数据库。
有没有一种方法可以查询数据库,以获得出现次数最多的客户端?例如,在本例中是带有2的C1。
我不确定是否可以使用Pycassa直接查询Cassandra。如果可能,我如何实现这一点,或者我应该使用其他工具?
谢谢
PS:我需要使用nosql,所以请不要建议我使用关系型数据库。
发布于 2012-11-22 10:49:12
您需要单独跟踪每个客户端的发生次数。如果不需要完美的准确性,您可以使用Cassandra的内置分布式计数器。否则,您将需要使用更精确的方案(计数列、定期重新计数或两者兼而有之),或者将计数器存储在关系数据库中。
https://stackoverflow.com/questions/13477692
复制相似问题