Flink的容错机制（checkpoint）

其他 2021-11-21 07:22:52 阅读次数: 0

Flink的可靠性基石-Checkpoint容错机制

1.概述

flink 的checkpoint机制可以保证Flink 整个集群在某个算子因为某些原因出现故障时，能够将整个应用流图的状态恢复到故障之前的某一状态，保证应用流图的状态一致性。Flink的Checkpoint机制原理来自“Chandy-Lamport algorithm”算法。

2.原理

每个需要Checkpoint的应用在启动时，Flink的JobManager为其创建一个CheckpointCoordinator（检查点协调器），CheckpointCoordination全权负责本应用的快照制作。

过程：

在这里插入图片描述

（1）CheckpointCoordinator(检查点协调器) 周期性的向该流应用的所有source算子发送 barrier(屏障)。

（2）当某个source算子收到一个barrier时，便暂停数据处理过程，然后将自己的当前状态制作成快照，并保存到指定的持久化存储中，最后向CheckpointCoordinator报告自己快照制作情况，同时向自身所有下游算子广播该barrier，恢复数据处理

（3）下游算子收到barrier之后，会暂停自己的数据处理过程，然后将自身的相关状态制作成快照，并保存到指定的持久化存储中，最后向CheckpointCoordinator报告自身快照情况，同时向自身所有下游算子广播该barrier，恢复数据处理。

（4）每个算子按照步骤3不断制作快照并向下游广播，直到最后barrier传递到sink算子，快照制作完成。

（5）当CheckpointCoordinator收到所有算子的报告之后，认为该周期的快照制作成功; 否则，如果在规定的时间内没有收到所有算子的报告，则认为本周期快照制作失败。

3.Flink 的Checkpoint与Spark的相比，Flink有什么区别或者优势吗？

Spark Streaming的Checkpoint仅仅针对的是Driver的故障恢复做了数据和元数据的Checkpoint。而Flink的Checkpoint机制要复杂的多，它采用的是轻量级的分布式快照，实现了每个算子的快照，及流动中的数据的快照。

猜你喜欢

转载自blog.csdn.net/weixin_48929324/article/details/118398886

Flink容错机制(checkpoint)

Flink的容错机制（checkpoint）

Flink 状态管理与checkPoint数据容错机制

Flink 状态管理/容错机制(CheckPoint & SavePoint)

Flink 容错机制 —— CheckPoint【含示例源码】

Flink 学习八 Flink 容错机制 & checkpoint & savepoint

Flink 状态管理与容错机制(CheckPoint & SavePoint)的关系

RDD容错机制Checkpoint

Flink 状态管理与checkPoint数据容错机制深入剖析-Flink牛刀小试

Flink的checkpoint机制

Flink checkpoint机制详解

spark -- RDD容错机制Checkpoint

SparkCore:RDD容错机制Checkpoint

【Flink】容错机制

Flink 容错机制与状态

Apache Flink的容错机制

【Flink】（八）容错机制

Flink (十) --------- 容错机制

Flink容错机制介绍

flink超越Spark的Checkpoint机制

【Flink】Flink 新一代流计算和容错 Unaligned Checkpoint、快速Checkpoint、更小的Checkpoint

Spark中RDD容错机制Checkpoint

Flink --- 容错机制Fault Tolerance

Flink原理（五）——容错机制

六、flink--容错机制

大数据Flink（七十九）：SQL 的容错（Checkpoint）

Flink源码阅读（一）--Checkpoint触发机制

Flink 专题 -2 Checkpoint、Savepoint 机制

Flink CheckPoint状态点恢复与savePoint机制

Flink的可靠性保证 – CheckPoint机制

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)