首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Spark和性能分析或执行计划

Spark和性能分析或执行计划
EN

Stack Overflow用户
提问于 2017-04-02 17:50:19
回答 1查看 7.2K关注 0票数 5

spak中有什么工具可以帮助理解代码是如何解释和执行的吗?例如分析工具或执行计划的细节,以帮助优化代码。

例如,我已经看到,最好在联接键上对两个数据帧进行分区,然后再将它们联接起来,以避免额外的混洗。我们怎么才能弄清楚呢?

EN

回答 1

Stack Overflow用户

发布于 2017-04-05 23:50:43

正如Pushkr所说,有了dataframe和dataset,我们可以使用.explain()方法来显示派生、分割和最终的混洗。

使用RDD,我们可以使用toDebugString来获得相同的结果。此外,还存在依赖关系来指示新的rdd是从具有窄依赖关系的前一个rdd派生出来的,还是从具有宽依赖关系的前一个rdd派生出来的。

票数 9
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/43166954

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档