我想知道flink.In单机模式的详细故障恢复过程,我猜有一些步骤,比如TaskManager故障,首先检测故障,所有任务停止处理,然后重新部署任务。然后从HDFS下载检查点,每个操作员加载状态。加载完成后,源端将继续发送数据。我说的对吗?有没有人知道正确和详细的恢复过程?
发布于 2019-04-04 02:44:19
Flink通过检查点从故障中恢复。检查点可以存储在本地S3或HDFS中。当恢复时,不同运算符的所有状态都将恢复。
具体的恢复过程,真的要看你的后台。如果您使用的是RocksDB。
如果您不需要更改后端,incremental
https://stackoverflow.com/questions/55496675
复制相似问题