文章/答案/技术大牛

发布

社区首页 >问答首页 >蜂巢/ Tez作业不会开始

问蜂巢/ Tez作业不会开始
EN

Stack Overflow用户

提问于 2016-02-20 18:49:41

回答 1查看 2.5K关注 0票数 0

我试图通过从HDFS中的文本文件导入ORC table来在Hive中创建一个。我尝试过多种不同的方式，在网上搜索帮助，不管插入作业不会启动。

我可以将文本文件读取到HDFS，我可以将文本文件读取到Hive，但是不能将文本文件转换为ORC.。

我尝试了许多不同的变体，包括这个可以用来引用这个问题的变体：

method.html

我有一个单节点HDP集群(用于开发)-版本：

HDP-2.3.2.0

(2.3.2.0-2950)

以下是相关的服务版本：

服务版本状态描述

HDFS 2.7.1.2.3安装Apache分布式文件系统

MapReduce2 2.7.1.2.3安装Apache MapReduce (纱线)

安装了Apache MapReduce (纱线)

Tez 0.7.0.2.3安装的Tez是下一代Hadoop查询处理框架，写在纱线上。

安装了用于即席查询的数据仓库系统&大型数据集和表存储管理服务的分析

当我运行这样的SQL时会发生什么(同样，我尝试了许多变体，包括直接来自在线教程)：

插入覆盖表，我的汽车选择*从汽车；

我的工作就是这样：

申请总数(申请类型：[]，并说明：

提交、接受、运行)：1

Application-Id      Application-Name        Application-Type          User       Queue               State         Final-State         Progress                        Tracking-URL

application_1455989658079_0002  HIVE-3f41161c-b806-4e7d-974e-c18e028d683f                    TEZ          hive   root.hive            ACCEPTED           UNDEFINED               0%                                 N/A

它就挂在那里。(从字面上讲，我已经尝试了一个20行示例表，并让它运行了几个小时之后才杀死它)。

我还不是Hadoop专家，我确信这可能是一个配置问题，但我一直无法弄清楚。

我尝试过的所有其他Hive操作，如创建删除表、将文件加载到文本表、选择、所有操作都很好。当我创建一个ORC表时，它就是这样做的。我需要一张兽人桌来满足我的要求。

任何建议都会有帮助。

hadoop

hive

hiveql

hortonworks-data-platform

tez

回答 1

Stack Overflow用户

发布于 2018-10-17 14:40:36

大多数情况下，这与增加Yarn调度能力有关，但如果资源已经被限制，您还可以通过调整TEZ配置中的以下属性，减少单个TEZ任务请求的内存量：

task.resource.memory.mb

为了增加集群的容量，您可以在纱线的配置设置中或直接通过Ambari或Cloudera Manager来实现该功能。

为了监视引擎背后发生的事情，您可以运行并检查特定应用程序的诊断选项卡，在资源分配方面有一些有用的显式消息，特别是当作业被接受并一直挂起时。

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/35527542

复制

相似问题

问蜂巢/ Tez作业不会开始
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问蜂巢/ Tez作业不会开始EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问蜂巢/ Tez作业不会开始
EN