我有一个Flink HA集群,有2个作业管理器和3个节点的动物园管理员仲裁。
我的失败的工作经理在我杀了它之后没能康复。下面是我怎么做的,以及我所观察到的:
我是在这里遗漏了什么吗?还是HA不能处理这样的故障转移( flink实例直接被杀死)?
谢谢!
发布于 2018-02-01 13:01:01
HA在独立模式下的工作方式与您所描述的完全一样,这意味着当当前的领导失败时,备用工作经理将接管。
独立模式下的Jobmanager只是一个java进程,在关闭后不能自动生成,所以您必须手动生成它。您还可以考虑其他一些部署模式,例如纱线/Mesos/Kubernetes,这将确保重新启动流程。
https://stackoverflow.com/questions/48556497
复制相似问题