首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Oozie工作流处理目录中的多个文件

Oozie工作流处理目录中的多个文件
EN

Stack Overflow用户
提问于 2015-03-11 12:34:00
回答 1查看 1.1K关注 0票数 0

用例:

我有一个协调器,它将一个包含多个文件的目录传递给一个工作流。工作流有以下节点:

代码语言:javascript
复制
    java node 1 :   Reads the file, and does some json parsing gets some input values to below nodes. Done using <capture-output>.
    pig node 1  :   Does some action. Requires above input values from parsed json.
    pig node 2  :   Same as above
    pig node 3  : ................
    ..................

问题:

协调器将目录名传递给工作流。我想做以下几件事:

代码语言:javascript
复制
for every file in directory {
    java node 1 : get config from file X
    pig node 1  : ...............
    ..............
}

请建议一种我可以这样做的方法。

下面的是协调器:

代码语言:javascript
复制
                      LAST\_ONLY         
代码语言:javascript
复制
    <datasets>
            <dataset name="input" frequency="${datasetFrequency}" initial-instance="${datasetInitialInstance}" timezone="UTC">
                    <uri-template>${nameNode}/user/${coord:user()}/alertcampaign/${YEAR}/${MONTH}/${DAY}/${HOUR}/${MINUTE}</uri-template>
                    <done-flag></done-flag>
            </dataset>
    </datasets>

    <input-events>
            <data-in name="inputLogs1" dataset="input">
                    <instance>${coord:current(0)}</instance>
            </data-in>

    </input-events>

    <action>
       <workflow>
             <app-path>${nameNode}/user/${coord:user()}/test.xml</app-path>
                   <configuration>
                            <property>
                                    <name>wfInput</name>
                                    <value>${coord:dataIn('inputLogs1')}</value>
                            </property>
                    </configuration>
      </workflow>

EN

回答 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/28986737

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档