首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >在spark-submit命令中设置default.parallelism

在spark-submit命令中设置default.parallelism
EN

Stack Overflow用户
提问于 2020-09-27 04:10:18
回答 1查看 767关注 0票数 0

在执行spark-submit作业时,更改默认并行度的语法是什么?

在提交spark作业时,我可以通过以下命令指定executor、executor内核和executor内存的数量:

代码语言:javascript
复制
spark-submit --num-executors 9 --executor-cores 5 --executor-memory 48g

conf文件中指定并行度为:

代码语言:javascript
复制
spark.conf.set("spark.default.parallelism",90)

如果我在spark-submit命令中更改它,它会是?:

代码语言:javascript
复制
spark-submit --default.parallelism 90
EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2020-09-27 04:24:14

根据Launching Application with spark-submit上的Spark文档,spark-submit命令具有以下语法:

代码语言:javascript
复制
./bin/spark-submit \
  --class <main-class> \
  --master <master-url> \
  --deploy-mode <deploy-mode> \
  --conf <key>=<value> \
  ... # other options
  <application-jar> \
  [application-arguments]

在您的案例中,如果您想要更改前面提到的配置,则需要添加以下内容。

代码语言:javascript
复制
spark-submit [...] --conf spark.default.parallelism=90
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/64082075

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档