在我工作的集群上,每个用户都有60 On的Hadoop配额。从历史上看,我正在从事的项目会生成大量的Hive查询。为了更快地工作,我试图并行这些查询(它们是无关的),但结果是目录/user/{myusername}/.staging/被job_{job_}目录填充,而这些目录又被hive jar填充,并且非常快地消耗了这60 to的空间。虽然我可以限制并行化因素,但我也想看看是否可以让Hive将这些jars放在不同的目录中。例如/tmp/{myusername},其中我有更多的空间。
知道如何告诉Hive/Beeline在/tmp/{myusername}下创建.staging目录吗?
发布于 2016-09-01 23:51:42
最简单的方法是执行你的直线会话。
beeline --hive.exec.stagingdir=/tmp/{myusername}我认为你可以通过!设置在直线内,但是手头没有语法。
发布于 2018-04-16 21:39:09
上面的方法不起作用。
我们发现下面的方法是可行的
beeline --hiveconf hive.exec.stagingdir=/tmp/{myusername}
https://stackoverflow.com/questions/37908837
复制相似问题