场景: RDD中的大量对象集合,然后是昂贵的map函数,然后是collection。
映射函数需要不同的时间。
我假设分区最初是均匀分布在工人之间的。
如果一个工作人员碰巧得到了很多速度较慢的分区,那么其他节点会从过度工作的节点中获取分区吗?
发布于 2015-06-22 16:14:19
启动投机来解决这个问题。你可以看看这段视频:从34分钟到56分钟的https://www.youtube.com/watch?v=HG2Yd-3r4-M,以深入理解它的工作原理。
希望这能帮上忙
勒奎克
https://stackoverflow.com/questions/28639504
相似问题