有没有一种方法可以微调Hadoop配置参数,而不必为每种可能的组合运行测试?我目前在一个8节点的集群上工作,我想优化map reduce任务的性能以及spark性能(在hdfs上运行)。
发布于 2019-04-20 00:26:14
简短的回答是否定的。您需要尝试并运行冒烟测试,以确定集群的最佳性能。所以我想先看看这些
链接:
讨论的一些主题将影响MapReduce作业:
读取或写入
为了让您了解如何在YARN/TEZ中设置4节点32核心每节点128 up集群:(来自Hadoop multinode cluster too slow. How do I increase speed of data processing?)
对于Tez:除以内存/核心=最大TEZ容器大小,因此在我的示例中:128/32 = 4 4GB
TEZ:

纱线:
我喜欢在每个节点上运行最大内存,我的内存比推荐的要高一点,但是推荐值会导致TEZ/MR作业崩溃,所以在我的情况下,76 to的内存更好。你需要玩弄所有这些值!

https://stackoverflow.com/questions/55764777
复制相似问题