我有一个15 TB左右纱线资源的集群。我试图通过Hive.My提交一个查询,纱线上的默认容器大小是4GB。映射器为该查询分配的值约为1000。我已经被分配了10 %的资源在我的纱线队列中。因此,在同一时间内,只会分配430个货柜。每个映射器总共分配一个容器。HDFS上的块大小为128 MB。如何选择查询。
发布于 2017-11-05 21:05:47
您已经提到了内存设置,这听起来不错,因此优化查询的下一步步骤(因为您没有给它)是
SET tez.queue.name)WHERE子句将您的Hive表划分到最有意义的列上。https://stackoverflow.com/questions/47124434
复制相似问题