首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >cron中的spark-submit调度

cron中的spark-submit调度
EN

Stack Overflow用户
提问于 2015-02-25 00:06:30
回答 2查看 5K关注 0票数 1

我想在crontab中安排一个pyspark脚本,每5分钟运行一次。我已经使用以下命令成功地手动启动了脚本:

代码语言:javascript
复制
spark-submit script.py

问题是,当从crontab启动时,相同的命令似乎不起作用。日志不显示任何细节(它们被截断)

代码语言:javascript
复制
*/5 * * * * /path/script.sh

script.sh文件包含: spark-submit script.py

如果你对如何解决这个问题有任何想法,请告诉我。

EN

回答 2

Stack Overflow用户

发布于 2016-02-26 01:42:16

您应该将其放在一个bash文件中,并在cron上运行以下代码:

Bash文件Your_Script.sh

代码语言:javascript
复制
#!/bin/bash
echo "RUNNING JOB"
/opt/mapr/spark/spark-1.5.2/bin/spark-submit /Path/To/Your_Script.py parama1

所以你可以很容易地从crantab运行它,如下所示:

代码语言:javascript
复制
32 18 * * *  /Path/To/Your_Script.sh
票数 2
EN

Stack Overflow用户

发布于 2018-09-07 18:56:41

我和你遇到了同样的问题。我通过两个步骤解决了它:

  1. 参见cron日志:在Centos中,日志的路径为/var/spool/
  2. /${username}。我的日志显示:找不到hadoop和$JAVA_HOME
  3. source /etc/profile:因为$JAVA_HOME和$HADOOP_HOME配置在我的操作系统的/etc/profile中。如果在~/.bashrc中配置了$JAVA_HOME和$HADOOP_HOME,则应使用source ~/.bashrc
票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/28700624

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档