首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >关于oozie发射器作业的澄清

关于oozie发射器作业的澄清
EN

Stack Overflow用户
提问于 2016-03-18 06:52:01
回答 1查看 691关注 0票数 1

我需要一些关于oozie发射器工作的说明。

( 1)启动作业是在每个工作流应用程序(包含多个操作)还是工作流应用程序中的每个操作中启动?

2)用例:我有包含多个shell操作的工作流(在内部执行星星之火、蜂巢、猪操作等)。使用shell的原因是,可以使用自定义逻辑计算分区日期等附加参数,并使用.q文件将其传递给单元格。

示例Shell文件:

代码语言:javascript
复制
hive -hiveconf DATABASE_NAME=$1 -hiveconf MASTER_TABLE_NAME=$2 -hiveconf SOURCE_TABLE_NAME=$3 -hiveconf -f $4

示例.q文件:

代码语言:javascript
复制
use ${hiveconf:DATABASE_NAME};
insert overwrite into table ${hiveconf:MASTER_TABLE_NAME} select * from ${hiveconf:SOURCE_TABLE_NAME};

我将oozie.launcher.mapreduce.job.queuenamemapreduce.job.queuename设置为不同的队列,以避免单个队列中的任务槽饥饿。我还在相应的<capture-output></capture-output>操作中省略了shell。但是,我仍然看到启动程序任务占用了启动队列中的大量内存。

  • 这是因为发射程序会缓存来自蜂巢的日志输出吗?
  • 在以我的方式执行shell操作时,是否需要给启动程序工作足够的内存?
  • 如果我明确限制启动程序的作业内存,会发生什么情况?

如果有人能概述oozie发射器的工作职责,我会非常感激的。

谢谢!

EN

回答 1

Stack Overflow用户

发布于 2016-03-21 11:11:17

启动作业是在每个工作流应用程序(包含多个操作)还是工作流应用程序中的每个操作中启动的?

启动作业将在工作流中的每个操作中启动。

我强烈建议您使用各自的oozie操作、Hive、Pig等,因为它允许oozie以更好的方式处理您的工作流和操作。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/36077951

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档