首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >火花高可用性

火花高可用性
EN

Stack Overflow用户
提问于 2016-03-15 11:04:05
回答 1查看 1K关注 0票数 1

我在三个节点上使用spark 1.2.1,这些节点运行三个具有从配置的工作人员,并通过以下方式运行日常作业:

代码语言:javascript
复制
./spark-1.2.1/sbin/start-all.sh

//crontab configuration:
./spark-1.2.1/bin/spark-submit --master spark://11.11.11.11:7077 --driver-class-path home/ubuntu/spark-cassandra-connector-java-assembly-1.2.1-FAT.jar --class "$class" "$jar"

我想让火花主和从工随时可用,即使失败了,我也需要像服务一样重新启动它(就像cassandra那样)。

有什么办法吗?

编辑:

我查看了start-all.sh脚本,它只包含start-master.sh . the脚本和start-slaves.sh脚本的设置。我试图为它创建一个主管配置文件,并且只获得以下错误:

代码语言:javascript
复制
11.11.11.11: ssh: connect to host 11.11.11.12 port 22: No route to host
11.11.11.13: org.apache.spark.deploy.worker.Worker running as process 14627. Stop it first.
11.11.11.11: ssh: connect to host 11.11.11.12 port 22: No route to host
11.11.11.12: ssh: connect to host 11.11.11.13 port 22: No route to host
11.11.11.11: org.apache.spark.deploy.worker.Worker running as process 14627. Stop it first.
11.11.11.12: ssh: connect to host 11.11.11.12 port 22: No route to host
11.11.11.13: ssh: connect to host 11.11.11.13 port 22: No route to host
11.11.11.11: org.apache.spark.deploy.worker.Worker running as process 14627. Stop it first.
EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2016-03-15 11:27:42

有些工具,如monit和supervisor (甚至systemd),可以监视和重新启动失败的进程。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/36009436

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档