首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >纱线Terasort对于7和14个工作节点具有相同的执行时间。

纱线Terasort对于7和14个工作节点具有相同的执行时间。
EN

Stack Overflow用户
提问于 2015-06-27 07:24:30
回答 2查看 332关注 0票数 0

我有一个由15个节点(1个主节点和14个从节点)组成的hadoop集群,其复制因子为3。我使用以下命令在纱线中运行了TeraSort 10 15:

代码语言:javascript
复制
yarn jar ./share/hadoop/mapreduce/hadoop-mapreduce-examples-2.6.0.jar terasort /terasort-input /terasort-output

在完成了对14个功能节点的操作之后,我开始一次分解一个节点,然后再次运行TeraSort,查看执行时间是如何变化的。我注意到,当我缩小规模时,执行时间实际上并没有太大的变化,所以即使在7个从节点上,我也有类似的执行时间。

JobHistory回顾这个值:

14奴隶:经过:32分钟,12秒;平均地图时间:4分钟,4秒;平均洗牌时间:14分钟,56秒;平均合并时间:3min,50秒;平均减少时间:11分钟,35秒;

11奴隶:经过:30分钟,6秒;平均地图时间:5分钟,2秒;平均洗牌时间:6分钟,9秒;平均合并时间:8分钟,52秒;平均减少时间:11分钟,39秒;

8奴隶:经过:32分钟,15秒;平均地图时间:4分钟,29秒;平均洗牌时间:13分钟,48秒;平均合并时间:4分钟,20秒;平均减少时间:11分钟,11秒;

7奴隶:经过:30分钟,6秒;平均地图时间:4分钟,28秒;平均洗牌时间:7分钟,26秒;平均合并时间:8min,26秒;平均减少时间:11分钟,24秒;

问题:

  • 为什么对于不同数量的工作节点,我几乎有相同的执行时间?
  • 如何充分利用Hadoop集群,使作业在14个工作节点上比7个节点运行得更快?
EN

回答 2

Stack Overflow用户

发布于 2015-06-28 05:38:24

1.请使用较大的数据大小再次运行Terasort。

2.将块体变大,例如256米。您设置了多少个精简任务?如果太小,就把它放大一点。

票数 0
EN

Stack Overflow用户

发布于 2015-07-02 05:08:20

0)如果您没有指定映射器和还原器的#,那么默认情况下,您有两个映射器和一个减缩器。使用-D mapred.map.tasks -D mapred.reduce.tasks

1)数据集太小,所以发生奇怪行为的结果很低。

2)检查你的IO。如果每个节点有一个旋转磁盘,这不是一个好主意。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/31086262

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档