首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Hadoop -仅针对Reduce的故障恢复

Hadoop -仅针对Reduce的故障恢复
EN

Stack Overflow用户
提问于 2012-03-09 16:06:18
回答 1查看 268关注 0票数 1

我有一个Hadoop作业正在运行,它已经完成地图部分4天了,现在它似乎在reduce阶段被挂起(reducer完成了30%)

我真的希望有一种方法,如果可能的话,只重新处理reduce部分,而不需要重新处理长期的map部分,有什么建议吗?可能更糟糕的是,我只有一个减速器。

EN

回答 1

Stack Overflow用户

发布于 2012-03-09 16:47:07

Hadoop只会在您的情况下重新启动Reduce步骤。

但是,如果您的工作失败了,您不能跳过map步骤。在这种情况下,您可能应该将这两个阶段划分为单独的作业,特别是如果您的映射器是计算密集型的。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/9630750

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档