我正在使用(1.2)和Apache还原来处理一些数据。目前,我使用的是来自CqlPagingInputFormat的org.apache.cassandra.hadoop.cql3。此提供程序使用Th残留物来提取数据。它似乎相当慢(在一个3节点集群中,300米记录需要8+小时才能读取),而且由于存在一个本地二进制协议,我想知道是否有人使用过它。
我不感兴趣的任何其他优化和配置调整-这是一个单独的问题。
我的问题是
发布于 2014-04-24 09:47:24
Cassandra 2.0.7包含了用于CQL Hadoop类的本地协议类似物:
org.apache.cassandra.hadoop.cql3.CqlInputFormat org.apache.cassandra.hadoop.cql3.CqlRecordReader org.apache.cassandra.hadoop.cql3.CqlConfigHelper
示例/hadoop_cql3 3_word_count中的WordCount代码已经更新以使用这些类。
介绍这一点的JIRA是https://issues.apache.org/jira/browse/CASSANDRA-6311
https://stackoverflow.com/questions/23197729
复制相似问题