首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >作业经理没有恢复动物园管理员检查点

作业经理没有恢复动物园管理员检查点
EN

Stack Overflow用户
提问于 2018-11-27 12:15:18
回答 1查看 497关注 0票数 1

我们在我们的K8s环境中部署了Flink作业集群(一个作业管理器和一个任务管理器),并将其配置为HA模式(连接到动物园管理员)。作业是有状态的,检查点是使用RocksDB后端启用的。问题是任务管理器重新启动是正确地从上一个检查点恢复的,但是作业管理器重新启动则不是:

代码语言:javascript
复制
[flink-akka.actor.default-dispatcher-5]recover: 2018-11-27 11:23:26,531 INFO  o.a.f.r.c.ZooKeeperCompletedCheckpointStore Recovering checkpoints from ZooKeeper.
[flink-akka.actor.default-dispatcher-5]recover: 2018-11-27 11:23:26,596 INFO  o.a.f.r.c.ZooKeeperCompletedCheckpointStore Found 0 checkpoints in ZooKeeper.
[flink-akka.actor.default-dispatcher-5]recover: 2018-11-27 11:23:26,597 INFO  o.a.f.r.c.ZooKeeperCompletedCheckpointStore Trying to fetch 0 checkpoints from storage.

这些检查点被持久化到和动物园管理员。

flink-conf.yaml中的相关性质

代码语言:javascript
复制
metrics.reporters: prom
metrics.reporter.prom.class: org.apache.flink.metrics.prometheus.PrometheusReporter
high-availability: zookeeper
high-availability.zookeeper.quorum: our-k8s-zookeeper-service:2181
high-availability.zookeeper.path.root: /flink
high-availability.cluster-id: /service_cluster
high-availability.storageDir: gs://our-flink-bucket/namespace/service/ha
high-availability.jobmanager.port: 6123
state.backend.fs.memory-threshold: 0
state.checkpoints.dir: gs://our-flink-bucket/namespace/service/checkpoints

我们在这里少了什么?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2018-11-29 09:08:27

最后,我们发现了这个问题,似乎是Flink 1.6.1 (这一个)中的一个bug造成的。

升级到1.6.2解决了这个问题。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/53499490

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档