首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >在BigData环境中在哪里创建暂存数据表?

在BigData环境中在哪里创建暂存数据表?
EN

Stack Overflow用户
提问于 2015-07-15 07:30:13
回答 2查看 1.7K关注 0票数 0

我现在有Hadoop-2,猪,蜂箱和HBASE。我有个输入数据。我已经在HDFS中加载了这些数据。我想在这个环境中创建暂存数据。

我的疑问是-

在哪个BigData组件中,我应该创建暂存表(Pig/HIVE/HBASE);这将根据条件输入数据?稍后,我们可能希望运行具有复杂逻辑的MapReduce作业。

请协助

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2015-07-16 10:43:37

如果您有OLAP类型的工作负载,并且不需要实时读/写,Hive:

HBase: (如果您有OLTP类型的工作负载)。您需要进行实时/流式读写。一些批处理或OLAP处理可以使用MapReduce完成。类似SQL的查询是可以使用Apache凤凰的。

您可以在HIVE和HBase上运行HBase作业。

票数 0
EN

Stack Overflow用户

发布于 2015-07-15 15:31:58

任何你想去的地方。猪不是一种选择,因为它没有亚稳态。如果您需要类似于SQL的查询,请使用单元格。基于您的访问模式的HBase。

当您在数据之上运行一个Hive查询时,它被转换为MR. .

当您在Hive中创建它时,使用Hive查询&而不是使用MR,如果您正在使用MR,那么使用Pig。在数据的基础上创建一个Hive表不会有什么好处。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/31424102

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档