首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Map Reduce插槽定义

Map Reduce插槽定义
EN

Stack Overflow用户
提问于 2014-08-16 20:22:28
回答 4查看 6.5K关注 0票数 5

我正在成为cloudera Hadoop管理员的路上。从我开始,我听说了很多关于在Hadoop集群中计算每台机器的插槽,比如定义Map插槽和Reduce插槽的数量。

我在互联网上搜索了一段时间,以获得Map Reduce插槽的Noob定义,但没有找到。

通过PDF解释Map Reduce的配置,我真的很生气。

请解释一下,当涉及到集群的Machine中的一个计算插槽时,它到底是什么意思。

EN

回答 4

Stack Overflow用户

发布于 2014-09-27 21:26:25

在map-reduce v.1中,mapreduce.tasktracker.map.tasks.maximum和mapreduce.tasktracker.reduce.tasks.maximum用于配置map插槽的数量,并在mapred-site.xml中相应地减少插槽。

从map-reduce v.2 (YARN)开始,容器是一个更通用的术语,而不是插槽,容器表示在节点下可以并行运行的最大任务数,无论是Map任务、Reduce任务还是应用程序主任务(在YARN中)。

票数 4
EN

Stack Overflow用户

发布于 2014-09-28 15:47:04

通常,它取决于CPU和内存

在out集群中,我们为具有32Core、64G内存机器设置了20个map插槽和15个reduce插槽

1.大约一个插槽需要一个cpu核心

2.贴图槽的数量应该比reduce多一点

票数 0
EN

Stack Overflow用户

发布于 2015-04-28 04:23:49

在MRV1中,每台机器都有固定数量的专门用于映射和还原的插槽。一般来说,每台机器都配置了4:1的map:reducer比例。

从逻辑上讲,

  • 将读取大量数据(Map),并将它们压缩到较小的集合(Reduce)。

在MRV2中,容器的概念出现了,任何容器都可以运行map/reducer/shell脚本。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/25340098

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档