文章/答案/技术大牛

发布

社区首页 >问答首页 >hive.groupby.skewindata是否依赖于hive.optimize.skewjoin？

问hive.groupby.skewindata是否依赖于hive.optimize.skewjoin？
EN

Stack Overflow用户

提问于 2018-02-12 07:09:44

回答 1查看 1.4K关注 0票数 2

根据蜂巢模板：

hive.optimize.skewjoin：是否启用斜连接优化。算法如下:在运行时，检测带有大斜率的密钥。与其处理这些键，不如暂时将它们存储在HDFS目录中。在后续地图-减少作业，处理这些倾斜的键。对于所有的表，不需要对相同的键进行倾斜，因此，后续的映射-减少作业(对于倾斜的键)将更快，因为它将是一个map-join。

hive.groupby.skewindata：数据中是否存在倾斜，以便按查询优化组

但我不明白hive.groupby.skewindata是否依赖于hive.optimize.skewjoin？

hadoop

hive

bigdata

hiveql

回答 1

Stack Overflow用户

回答已采纳

发布于 2019-05-13 10:17:53

这两个属性处理两种不同的情况。当存在由group子句引起的倾斜时，可以使用hive.groupby.skewindata。当数据倾斜是由join子句引起时，可以使用hive.optimize.skewjoin。根本原因是一样的。蜂巢用相同的键将数据放入同一个减速机。

票数 2

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/48741145

复制

相似问题

问hive.groupby.skewindata是否依赖于hive.optimize.skewjoin？
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问hive.groupby.skewindata是否依赖于hive.optimize.skewjoin？EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问hive.groupby.skewindata是否依赖于hive.optimize.skewjoin？
EN