首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >使用AvroMultipleOutputs创建多个输出文件

使用AvroMultipleOutputs创建多个输出文件
EN

Stack Overflow用户
提问于 2013-04-06 00:06:23
回答 1查看 2.6K关注 0票数 2

我有一个使用AvroKeyOutput作为输出格式的Reducer。默认情况下,MapReduce会将我的所有密钥写入到一个输出文件中。我想为每个键值写一个单独的输出文件。Avro提供了AvroMultipleOutputs方法,但示例很少。由Apache AvroMultipleOutputs提供的一个示例展示了如何在定义作业时预先配置各种输出。示例显示:

作业:

AvroMultipleOutputs.addNamedOutput(job, "avro1", AvroOutputFormat.class, schema);

AvroMultipleOutputs.addNamedOutput(job, "avro2", AvroOutputFormat.class, null);

减速机:

amos = new AvroMultipleOutputs(conf);

amos.getCollector("avro1", reporter).collect(datum);

amos.getCollector("avro2", "A", reporter).collect(datum);

amos.getCollector("avro3", "B", reporter).collect(datum);

但我不知道我需要多少个文件,也不知道它们的名称是什么,因为它是基于我的reducer中的键值。我如何修改它以适应动态文件命名?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2013-06-07 05:00:40

你可以在这种情况下使用的策略:

对于AvroMultipleOutputs.write(String namedOutput, Object key, Object value, String baseOutputPath)中的基本输出路径,

  • 使用仅地图作业(零减去任务)
  • 具有单个命名的多个输出map()使用您的键值作为基本输出路径
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/15838547

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档