首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >映射器可以写入多个文件吗?

映射器可以写入多个文件吗?
EN

Stack Overflow用户
提问于 2013-10-27 19:04:31
回答 1查看 314关注 0票数 0

我是Hadoop和Map的新手,我使用的是Hadoop0.19的旧版本。我有一个程序来读取一个文件/excel,并给我列的内容作为一个列表的地点,地点,名称等。

假设映射器将我的输入文件分成2部分。这些映射器中的每一个都会给出上述实体的列表。

我的问题是:

  1. 如何保持对数据的跟踪,并从每个mapper.How中分别保存每个文件的位置和名称列表,将减少识别这些文件,并为每个文件提供合并的位置列表和另一个名称。

比如说医生-1:

代码语言:javascript
复制
list of places from mapper1---NY,1 US,2
list of names from mapper1---James 3 ,Ron 8
list of places from mapper-2 --NY 6 UK 5
list of names from mapper 2--Kate 9

就像这样。

如何保存每个映射器的输出以及每种类型的实体(如名称或位置)的输出。

还原剂将如何识别和减少只名称,并提出一个最终的列表或唯一的位置,并提出一个与该文件有关的最终列表。

请帮助我,并让我知道任何方法,帮助我用Java。

EN

回答 1

Stack Overflow用户

发布于 2013-10-28 09:30:39

如果这是一个纯映射作业,那么输出文件的数量将与Mappers相同。如果这是一个MapReduce作业,则可以指定减速器的数量。提供一个分区程序,将数据从特定的Mapper发送到特定的减速器。如果您不确定Mappers的数量,则使减速器的数量略高于总数,并且只使用Partitioner的第一个n个减速器。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/19622170

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档