首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >hive.groupby.skewindata是否依赖于hive.optimize.skewjoin?

hive.groupby.skewindata是否依赖于hive.optimize.skewjoin?
EN

Stack Overflow用户
提问于 2018-02-12 07:09:44
回答 1查看 1.4K关注 0票数 2

根据蜂巢模板:

hive.optimize.skewjoin:是否启用斜连接优化。算法如下:在运行时,检测带有大斜率的密钥。与其处理这些键,不如暂时将它们存储在HDFS目录中。在后续地图-减少作业,处理这些倾斜的键。对于所有的表,不需要对相同的键进行倾斜,因此,后续的映射-减少作业(对于倾斜的键)将更快,因为它将是一个map-join。

hive.groupby.skewindata:数据中是否存在倾斜,以便按查询优化组

但我不明白hive.groupby.skewindata是否依赖于hive.optimize.skewjoin

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2019-05-13 10:17:53

这两个属性处理两种不同的情况。当存在由group子句引起的倾斜时,可以使用hive.groupby.skewindata。当数据倾斜是由join子句引起时,可以使用hive.optimize.skewjoin。根本原因是一样的。蜂巢用相同的键将数据放入同一个减速机。

票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/48741145

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档