当在Oozie中创建工作流时,我有了第一个java步骤,它生成一个文件,其中包含下一步所需的文件列表(映射-约简)。我怎样才能用那个文件给地图减少作业呢?
我知道我可以在java步骤的捕获输出框中打勾,然后在map中使用mapred.input.dir -还原步骤来使用捕获的输出作为输入。但我想把自己从这件事中解脱出来。
为了记录在案,我的文件的内容看起来如下:
/data/kafka/4/camus/DATA.TRADE.ORDERHISTORY/daily/2015/07/18,/data/kafka/4/camus/DATA.TRADE.ORDERHISTORY/daily/2015/07/19,/data/kafka/4/camus/DATA.TRADE.ORDERHISTORY/daily/2015/07/20,/data/kafka/4/camus/DATA.TRADE.ORDERHISTORY/daily/2015/07/21,/data/kafka/4/camus/DATA.TRADE.ORDERHISTORY/daily/2015/07/22,/data/kafka/4/camus/DATA.TRADE.ORDERHISTORY/daily/2015/07/23,/data/kafka/4/camus/DATA.TRADE.ORDERHISTORY/daily/2015/07/24,/data/kafka/4/camus/DATA.TRADE.ORDERHISTORY/daily/2015/07/25,/data/kafka/4/camus/DATA.TRADE.ORDERHISTORY/daily/2015/07/26,/data/kafka/4/camus/DATA.TRADE.ORDERHISTORY/daily/2015/07/27,/data/kafka/4/camus/DATA.TRADE.ORDERHISTORY/daily/2015/07/28
发布于 2015-08-05 21:40:57
要将该文件用作输入文件还是参数文件??
在第二个案例中,
https://stackoverflow.com/questions/31827314
复制相似问题