Flink 1.9 重启策略和故障恢复策略 - 代码天地

Flink 1.9 重启策略和故障恢复策略

其他 2019-12-16 15:01:12 阅读次数: 0

当 Task 发生故障时，Flink 需要重启出错的 Task 以及其他受到影响的 Task ，以使得作业恢复到正常执行状态。

Flink 通过重启策略和故障恢复策略来控制 Task 重启：重启策略决定是否可以重启以及重启的间隔；故障恢复策略决定哪些 Task 需要重启。

全图重启故障恢复策略

在全图重启故障恢复策略下，Task 发生故障时会重启作业中的所有 Task 进行故障恢复。

基于 Region 的局部重启故障恢复策略

该策略会将作业中的所有 Task 划分为数个 Region。当有 Task 发生故障时，它会尝试找出进行故障恢复需要重启的最小 Region 集合。
相比于全局重启故障恢复策略，这种策略在一些场景下的故障恢复需要重启的 Task 会更少。

此处 Region 指以 Pipelined 形式进行数据交换的 Task 集合。也就是说，Batch 形式的数据交换会构成 Region 的边界。
- DataStream 和流式 Table/SQL 作业的所有数据交换都是 Pipelined 形式的。
- 批处理式 Table/SQL 作业的所有数据交换默认都是 Batch 形式的。
- DataSet 作业中的数据交换形式会根据 [ExecutionConfig]({{ site.baseurl }}/zh/dev/execution_configuration.html)
中配置的 [ExecutionMode]({{ site.javadocs_baseurl }}/api/java/org/apache/flink/api/common/ExecutionMode.html)
决定。

需要重启的 Region 的判断逻辑如下：
1. 出错 Task 所在 Region 需要重启。
2. 如果要重启的 Region 需要消费的数据有部分无法访问（丢失或损坏），产出该部分数据的 Region 也需要重启。
3. 需要重启的 Region 的下游 Region 也需要重启。这是出于保障数据一致性的考虑，因为一些非确定性的计算或者分发会导致同一个
Result Partition 每次产生时包含的数据都不相同。

猜你喜欢

转载自www.cnblogs.com/mrpei/p/flinkfailover.html

Flink 1.9 重启策略和故障恢复策略

5.3 flink的故障重启策略

Flink1.9重大改进和新功能

Flink 1.0到1.9特性

Flink1.9整合Kafka

Flink重启策略

Flink教程(6) Flink 重启策略

关于flink的重启策略学习

6-Flink重启策略

Flink的重启策略（RestartStrategy）实战

Apache Flink 1.9 重大特性提前解读

如何在 Flink 1.9 中使用 Hive？

Flink1.9 【Apache Kafka Connector】

大数据Flink（八十）：Checkpoint的状态后端和重启策略

Flink重启策略(restart-strategy)优化

Flink 1.9 实战：使用 SQL 读取 Kafka 并写入 MySQL

Flink 1.9 FlinkKafkaProducer 使用 EXACTLY_ONCE 错误记录

flink1.9升级&alink使用

0、展望---Flink 1.9版本变化及新特性

Flink 1.9 Table API& Sql支持的Data Type

flink 1.9 自编译适配Hadoop3.X版本

cdh6.2.1+flink1.9+druid1.8搭建实践

1.9

手动编译 Flink 1.9 flink-table-api-java问题

【Flink】Flink 1.9 本地运行无法访问界面 {"errors":["Not found."]}

Flink Restart Strategies重启策略机制深入剖析

大数据计算引擎之Flink的重启策略

Flink1.10入门：Checkpoint重启策略及代码演示

Flink Restart Strategies重启策略机制深入剖析-Flink牛刀小试

社区活动 | Apache Flink 1.9 版本即将发布，新版本有哪些新特性？

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)