在Hadoop的Terasort实现中,有一个名为TeraScheduler的调度程序。在阅读了代码之后,调度程序基本上完成了以下操作:
我不明白这个时间表背后的理由。它如何比默认调度程序执行得更好(无论如何,默认调度程序是什么)?有没有解释它的好处的文件?
发布于 2014-01-11 19:37:25
其好处有两方面:(1)使排序尽可能本地化。(2)在机器上平均分配工作。
两家公司的目标都是提高业绩。
https://stackoverflow.com/questions/20648990
复制相似问题