我们在一个特定的表上面临与Impala计算统计数据有关的问题。问题的详细情况列于下:
问题
有时,Impala的compute语句需要花费太多的时间来完成,或者只是在特定的表上失败。
表详细信息
尺寸: 45 GB带快速压缩的Parquet
记录编号:41亿
分区:在两列上分区。
观测成就了
解决方案尝试了
设置NUM_SCANNER_THREAD=2,然后运行计算统计数据查询。发布我们重置NUM_SCANNER_THREAD的消息。这一点也没有帮助。
集群大小
AWS上的1 r3.2xLargeNameNode= 39 r3.2xLargeDataNode
问题
任何帮助都将不胜感激。
发布于 2016-01-27 04:35:14
您可以使用impala web ui或impala日志查看在激发计算状态时触发了哪些查询。
是的,您可以在imapla配置中更改默认超时。
https://stackoverflow.com/questions/28379345
复制相似问题