首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Spark-Submit :无法使用virtualenv运行

Spark-Submit :无法使用virtualenv运行
EN

Stack Overflow用户
提问于 2020-01-29 01:15:40
回答 1查看 1.2K关注 0票数 3

我有一个python应用程序,我想使用spark submit通过虚拟环境运行它。以下是我的命令

代码语言:javascript
复制
PYSPARK_PYTHON=./venv/bin/python spark-submit --conf spark.yarn.appMasterEnv.PYSPARK_PYTHON=./venv/bin/python --master yarn --deploy-mode cluster --archives venv.zip#venv test.py

在这里,venv.zip是归档的虚拟环境。现在,当我运行spark-submit命令时,我在控制台上得到以下内容

代码语言:javascript
复制
20/01/28 17:08:12 INFO org.apache.hadoop.yarn.client.RMProxy: Connecting to ResourceManager at myMasterNode/some.ip:somePort
20/01/28 17:08:13 INFO org.apache.hadoop.yarn.client.AHSProxy: Connecting to Application History server at myMasterNode/some.ip:somePort
20/01/28 17:08:16 INFO org.apache.hadoop.yarn.client.api.impl.YarnClientImpl: Submitted application application_1580155727514_5620
Exception in thread "main" org.apache.spark.SparkException: Application application_1580155727514_5620 finished with failed status
    at org.apache.spark.deploy.yarn.Client.run(Client.scala:1165)
    at org.apache.spark.deploy.yarn.YarnClusterApplication.start(Client.scala:1520)
    at org.apache.spark.deploy.SparkSubmit$.org$apache$spark$deploy$SparkSubmit$$runMain(SparkSubmit.scala:894)
    at org.apache.spark.deploy.SparkSubmit$.doRunMain$1(SparkSubmit.scala:198)
    at org.apache.spark.deploy.SparkSubmit$.submit(SparkSubmit.scala:228)
    at org.apache.spark.deploy.SparkSubmit$.main(SparkSubmit.scala:137)
    at org.apache.spark.deploy.SparkSubmit.main(SparkSubmit.scala)

在纱线日志上,这是我所看到的

代码语言:javascript
复制
20/01/28 17:08:53 ERROR org.apache.spark.deploy.yarn.ApplicationMaster: User class threw exception: java.io.IOException: Cannot run program "./signal/bin/python": error=2, No such file or directory
java.io.IOException: Cannot run program "./venv/bin/python": error=2, No such file or directory
at java.lang.ProcessBuilder.start(ProcessBuilder.java:1048)

我做错了什么?如何确保venv.zip被正确地复制和解压?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2020-01-29 04:38:16

解压后将venv目录放入到#venv中。

spark.yarn.appMasterEnv.PYSPARK_PYTHON=./venv/venv/bin/python也应该如此

如果您将zip更改为tar.gz,则此问题将消失

票数 3
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/59953911

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档