首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >调整Hadoop参数

调整Hadoop参数
EN

Stack Overflow用户
提问于 2019-04-20 00:20:19
回答 1查看 295关注 0票数 1

有没有一种方法可以微调Hadoop配置参数,而不必为每种可能的组合运行测试?我目前在一个8节点的集群上工作,我想优化map reduce任务的性能以及spark性能(在hdfs上运行)。

EN

回答 1

Stack Overflow用户

发布于 2019-04-20 00:26:14

简短的回答是否定的。您需要尝试并运行冒烟测试,以确定集群的最佳性能。所以我想先看看这些

链接:

讨论的一些主题将影响MapReduce作业:

  • 配置HDFS块大小以获得最佳性能
  • 避免文件大小小于块大小
  • Tune JVM以获得最佳HDFS短路读取
  • 避免从过时的DataNodes

读取或写入

为了让您了解如何在YARN/TEZ中设置4节点32核心每节点128 up集群:(来自Hadoop multinode cluster too slow. How do I increase speed of data processing?)

对于Tez:除以内存/核心=最大TEZ容器大小,因此在我的示例中:128/32 = 4 4GB

TEZ:

纱线:

我喜欢在每个节点上运行最大内存,我的内存比推荐的要高一点,但是推荐值会导致TEZ/MR作业崩溃,所以在我的情况下,76 to的内存更好。你需要玩弄所有这些值!

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/55764777

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档