在我的happybase扫描调用中,我试图将正则表达式的列表传递给column属性。这是因为,我的列名是由动态添加的ids组成的,而我在扫描时无法访问这些ids。
这个是可能的吗?
发布于 2013-11-28 04:39:20
HappyBase的作者在这里。
根据Thrift API,您可以在ScannerOpen() API家族的columns参数中传递正则表达式(请参见http://svn.apache.org/viewvc/hbase/trunk/hbase-thrift/src/main/resources/org/apache/hadoop/hbase/thrift/Hbase.thrift?view=markup#l717)。但是,HappyBase使用的Thrift API是ScannerOpenWithScan(),它使用TScan结构(请参阅http://svn.apache.org/viewvc/hbase/trunk/hbase-thrift/src/main/resources/org/apache/hadoop/hbase/thrift/Hbase.thrift?view=markup#l141),该结构不包含关于正则表达式的任何注释。实际上,我不知道(没有测试)这是否有效。
一种更灵活、更强大的方法是使用happybase.Table.scan()的filter参数指定过滤器字符串。有关过滤器字符串的语法,请参见http://hbase.apache.org/book/thrift.html。在您的例子中,像"ColumnPrefixFilter('theprefix')"这样的东西应该可以做到这一点。HappyBase接口请参见http://happybase.readthedocs.org/en/latest/api.html#happybase.Table.scan。
发布于 2015-06-03 04:16:58
我不熟悉HBase的语法。下面是我使用的happybase python代码,它对我很有效。感谢Wouter Bolsterlee!与'columns‘语句不同,您不必将'columnFamily’放在'ColumnPrefixFilter‘中。
import happybase
pool = happybase.ConnectionPool(size=3, host='172.xx.xx.xx')
with pool.connection() as conn1:
hbaseTable = conn1.table('HBase_table_name_here')
for rowKey, rowData in hbaseTable.scan(row_prefix= 'year-2015-', filter="ColumnPrefixFilter('month-06')", limit = 6):
print rowDatahttps://stackoverflow.com/questions/19106722
复制相似问题