场景:我有节点A和节点B,每个节点都有100 mb的磁盘space.And,我想在其中存储128 mb文件(假设复制因子为1,块大小为64 mb),.How文件将在这个场景中存储吗?此外,需要多少映射器和还原剂来处理这个文件?假设我想用一个映射器处理这个文件,那么哪个节点将运行这个映射程序?
发布于 2016-01-20 20:09:49
我假设您所指的是两个数据节点A& B,因为集群作为一个整体只有A& B,它们中的任何一个都需要是名称节点,不能存储任何数据。
文件将被分割成两个64 be的块,A &B将托管每个一个块。不能说谁会有第一,谁会有第二。
在默认设置中,2映射器将处理各自节点中的拆分,one还原器将处理两个映射器的输出。
如果您只想强制使用一个映射器,第一个任务跟踪器的数据节点(心脏跳动到作业跟踪器)将运行映射器。
希望这能有所帮助。
https://stackoverflow.com/questions/34902514
复制相似问题