我遇到了一个计算没有分组的count distinct的配置单元查询,它运行得非常慢。所以我想知道这个功能是如何在Hive中实现的,有没有UDAFCountDistinct来实现这个功能?
发布于 2020-01-19 01:00:48
Hive 1.2.0+提供auto-rewrite optimization for count(distinct)。检查此设置:
hive.optimize.distinct.rewrite=true;https://stackoverflow.com/questions/59797712
复制相似问题