首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >HBase表上的SparkSQL

HBase表上的SparkSQL
EN

Stack Overflow用户
提问于 2016-09-16 19:58:12
回答 1查看 9.9K关注 0票数 7

任何人直接在HBase表上使用SparkSQL,就像在Hive表上使用SparkSQL一样。我是spark.Please新手,指导我如何连接hbase和spark.How来查询hbase表。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2016-09-20 00:28:02

AFAIK有两种方法可以连接到hbase表

-直接接入Hbase:

直接连接hbase并从RDD创建一个DataFrame,然后在上面执行SQL。我不打算重新发明轮子,请参阅How to read from hbase using spark,因为在上面的链接中@iMKanchwala的答案已经描述了它。唯一要做的就是将其转换为数据帧(使用toDF)并遵循sql方法。

-使用hbase存储处理程序将表注册为hive外部表,您可以在hivecontext中使用hive on spark。这也是一种简单的方法。

代码语言:javascript
复制
Ex : 
CREATE TABLE users(
userid int, name string, email string, notes string)
STORED BY 
'org.apache.hadoop.hive.hbase.HBaseStorageHandler' 
WITH SERDEPROPERTIES ( 
"hbase.columns.mapping" = 
”small:name,small:email,large:notes”);

具体操作方法请参阅example

我更喜欢方法1。

希望这能帮上忙。

票数 6
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/39530938

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档