首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >当只使用一台计算机/节点时,分区会提高性能吗?

当只使用一台计算机/节点时,分区会提高性能吗?
EN

Stack Overflow用户
提问于 2020-09-24 13:26:27
回答 2查看 50关注 0票数 1

我知道分区将通过在集群中的不同节点上执行并行任务来提高性能。但是,当我只使用一台计算机时,分区会帮助我获得更好的性能吗?我用的是火花和斯卡拉。

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2020-09-24 15:12:57

是的,这会提高性能。

确保您的CPU有多个核心。

当您使用本地火花会话时,请确保使用多个核心:

如果

  • local用一个线程在本地运行,或者local[N]用N个线程在本地运行,我建议您使用local[*]

并确保您的RDD/Dataset有多个分区,我很好的分区数量是内核数量的2到4倍。

票数 1
EN

Stack Overflow用户

发布于 2020-09-24 13:40:41

Apache火花也是垂直的(CPU,Ram,.)和水平(节点)。我假设,您的计算机/节点有一个具有多个核心的CPU。然后并行地处理这些分区。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/64047479

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档