Flink任务调度原理之并行度与任务链

其他 2020-09-09 04:48:32 阅读次数: 0

一、并行度

上一篇已经讲到了DataFlow与执行图，细心的小伙伴应该会发现为什么有些算子生成执行图时是两个，有些是一个呢？如果你注意到了这些证明你是真的很闲！！！好了为了看得更加明显先上图：
在这里插入图片描述
上面所描述的的也就是并行度！！！

1.1 什么是并行度

一个特定算子的子任务（subtask）的个数被称之为其并行度（parallelism）。一般情况下，一个 stream 的并行度，可以认为就是其所有算子中最大的并行度。

1.2 详解并行度

JobGraph中展示了A算子并行度为4,C为2等等。而他在TaskManager详细执行如下图：
在这里插入图片描述

一个程序中，不同的算子可能具有不同的并行度
算子之间传输数据的形式可以是 one-to-one (forwarding) 的模式也可以是redistributing 的模式，具体是哪一种形式，取决于算子的种类
One-to-one：stream维护着分区以及元素的顺序（比如A和B的关系）。这意味着B算子的子任务看到的元素的个数以及顺序跟 A子的子任务生产的元素的个数、顺序相同。map、fliter、flatMap等算子都是one-to-one的对应关系。
Redistributing：stream的分区会发生改变（比如图中的C和D的关系）。每一个算子的子任务依据所选择的transformation发送数据到不同的目标任务。例如，keyBy 基于 hashCode 重分区、而 broadcast 和 rebalance 会随机重新分区，这些算子都会引起redistribute过程，而 redistribute 过程就类似于 Spark 中的 shuffle 过程。

二、任务链

2.1 什么是任务链

上面讲到了并行度one-to-one(A和B的关系)，他们之间数据是一对一的，而而不像C和D的关系，那我们为什么不把他们组合在一起发送到同一台机器上去执行？这样不就避免了机器之间的通信开销吗？聪明！

2.2 详解任务链

为了更加清晰，先上图：
在这里插入图片描述

Flink 采用了一种称为任务链的优化技术，可以在特定条件下减少本地通信的开销。为了满足任务链的要求，必须将两个或多个算子设为相同的并行度，并通过本地转发（local forward）的方式进行连接
相同并行度的 one-to-one 操作，Flink 这样相连的算子链接在一起形成一个 task，原来的算子成为里面的 subtask
并行度相同、并且是 one-to-one 操作，两个条件缺一不可

猜你喜欢

转载自blog.csdn.net/qq_39657909/article/details/106005264

Flink任务调度原理之并行度与任务链

Flink任务调度原理以及Worker、Slots与并行度的概念

flink 并行度任务链 task分配

Flink任务调度原理之TaskManager 与Slots

Flink学习笔记7 Flink原理-任务及调度

Flink任务调度原理之逻辑数据流与执行图

Hadoop原理之_Azkaban任务调度

任务调度分配原理

spark任务调度原理

FreeRTOS任务调度原理

Flink 操作链与任务槽

任务调度之Quartz

Flink根据流式数据处理WordCount详解任务并行度

Flink 1.17教程：任务槽Task Slots和并行度的关系

Flink任务调度逻辑（基于1.12）

Flink概念基础-并行度、算子链

Quartz：任务调度实现原理

Milvus 查询任务调度原理

laravel 任务调度之任务输出

Springboot之异步任务和任务调度

Linux任务调度之定时任务

Spring任务调度之Quartz

任务调度之队列(queue)

Oracle（三）之任务调度

Spring任务调度之Timer

springboot之scheduled任务调度

Spring之任务调度Scheduled

任务调度之Oozie简介

javase之任务调度（了解）

Linux之crond任务调度

今日推荐

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

周排行

计算机组成与设计（七）—— 除法器

Integer Approximation(分治+枚举)

大话数据库索引

windows10系统JDK的配置及下载地址

mysql实现秒值转换中原六仔平台搭建

Codeforces Round #556 (Div. 1)

百练1064 网线主管

Codeforces 995F Cowmpany Cowmpensation

子集生成之增量构造法，位向量法，二进制法

ERROR: cmd.exe failed with args /c "/APK\gradle\rungradle.bat...

每日归档

更多

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)