首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何在生产集群中对spark作业进行性能调优?

如何在生产集群中对spark作业进行性能调优?
EN

Stack Overflow用户
提问于 2018-01-31 06:13:33
回答 1查看 251关注 0票数 1

假设我们有一个spark作业,我们正在进行所有的性能调优,并使其运行在开发环境中,该环境将具有有限的配置(1个节点32 job 500 job硬盘)

显然,我们的生产集群将是高的,在开发环境中测量的调优参数如何在生产集群中有所帮助。直接在生产集群中调优作业是否可取?它是如何实时完成的?

EN

回答 1

Stack Overflow用户

发布于 2018-05-25 13:49:32

不知羞耻的插件(作者)大多数时候尝试Sparklens https://github.com/qubole/sparklens,真正的问题不是应用程序是否很慢,而是它是否可以扩展。对于大多数应用程序,答案都是有限制的。

spark应用程序的结构对其可伸缩性有重要的限制。阶段中的任务数量、阶段之间的依赖关系、偏差和驱动程序端完成的工作量是主要的限制因素。

Sparklens最好的特性之一是它模拟并告诉你你的spark应用程序在不同的执行器计数下将如何执行。看起来很适合你的问题。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/48531391

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档