我想在crontab中安排一个pyspark脚本,每5分钟运行一次。我已经使用以下命令成功地手动启动了脚本:
spark-submit script.py问题是,当从crontab启动时,相同的命令似乎不起作用。日志不显示任何细节(它们被截断)
*/5 * * * * /path/script.shscript.sh文件包含: spark-submit script.py
如果你对如何解决这个问题有任何想法,请告诉我。
发布于 2016-02-26 01:42:16
您应该将其放在一个bash文件中,并在cron上运行以下代码:
Bash文件Your_Script.sh
#!/bin/bash
echo "RUNNING JOB"
/opt/mapr/spark/spark-1.5.2/bin/spark-submit /Path/To/Your_Script.py parama1所以你可以很容易地从crantab运行它,如下所示:
32 18 * * * /Path/To/Your_Script.sh发布于 2018-09-07 18:56:41
我和你遇到了同样的问题。我通过两个步骤解决了它:
source /etc/profile:因为$JAVA_HOME和$HADOOP_HOME配置在我的操作系统的/etc/profile中。如果在~/.bashrc中配置了$JAVA_HOME和$HADOOP_HOME,则应使用source ~/.bashrchttps://stackoverflow.com/questions/28700624
复制相似问题