Spark内核深度剖析 - 代码天地

Spark内核深度剖析

编程语言 2018-04-18 18:16:52 阅读次数: 5

一、相关的组件以及名词

1、Application

2、spark-submit

3、Driver

4、DAGscheduler

5、taskscheduler

6、Master

7、worker

9、exector

10、task

11、shufflemaptask and resulttask

二、各个组件执行流程如下

1、我们通过spark-submit提交我们的Application。

2、在提交完成之后会在我们的本地启动Driver进程，这个进程会创建一个sparkContext对象，它在初始化的时候会初始化很多相关的配置，其中一个是DAGscheduler还有一个是taskscheduler

3、taskscheduler在初始化完成之后会用自己的后台进程去连接Master，向master注册application

4、Master在接收到taskscheduler的请求时候，会利用自己的资源调度算法，为application启动exector

5、Master通知worker启动exector，在worker启动之后会反向注册到taskscheduler上去，到此为止sparkContext初始化完成

6、开始执行我们的代码，按照我们的逻辑，在代码中每遇到一个action就会创建一个job

7、把job提交给DAGscheduler，DAGscheduler把job划分为不同的stage，每一个stage创建一个taskset把它提交给taskscheduler

8、taskscheduler接收到taskset之后，将每一个task提交到exector上去执行

9、exector收到task之后会用taskrunner来封装task，然后在线程池中取出一个线程来执行task，在执行过程中会出现shufflemaptask和resulttask，只有最后一个是resulttask其他都是shufflemaptask

三、示意图

猜你喜欢

转载自blog.csdn.net/Milkcoffeezhu/article/details/79994266

Spark内核深度剖析

Spark内核架构深度剖析

Spark:内核架构深度剖析

Spark内核架构流程深度剖析

Spark内核解析之(8)Spark 核心组件深度剖析

Spark内核源码深度剖析（4） -Master解析

Spark内核源码深度剖析（8） -Task原理

Spark内核源码深度剖析（3） - SparkContext 解析

Spark内核源码深度剖析（9） - Shuffle原理

Spark内核源码深度剖析（6） - DAGScheduler原理

Spark内核源码深度剖析（5） -Worker解析

Spark内核源码深度剖析（12） -Checkpoint 原理

Spark内核源码深度剖析（10） -BlockManger 原理分析

Spark内核源码深度剖析（7） - Executor原理

Spark内核架构剖析

Spark内核源码深度剖析（1） - Spark整体流程和宽依赖和窄依赖

spark内核源码深度剖析（2）--Spark的三种提交模式

Spark内核解析之(5)Spark 任务调度原理机制深度剖析

深入剖析 Spark 内核（一）

Spark之内核架构剖析

【Spark二四】Spark内核源码剖析

Spark实战（2）_Spark内核架构剖析

SparkSQL 之 Shuffle Join 内核原理及应用深度剖析-Spark商业源码实战

Spark内核源码深度剖析（2） -基于 YARN 的两种提交模式

SparkContext内核架构深度剖析

Apache HBase 内核深度剖析

Apache Kafka 内核深度剖析

Linux内核链表深度剖析

基于Spark案例，对Spark内核源码在Standalone提交模式的深度剖析 (乾坤大挪移第一层)

Spark进阶，Scala编程、大数据开发、上百个实战案例、内核源码深度剖析

今日推荐

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

周排行

计算机组成与设计（七）—— 除法器

Integer Approximation(分治+枚举)

大话数据库索引

windows10系统JDK的配置及下载地址

mysql实现秒值转换中原六仔平台搭建

Codeforces Round #556 (Div. 1)

百练1064 网线主管

Codeforces 995F Cowmpany Cowmpensation

子集生成之增量构造法，位向量法，二进制法

ERROR: cmd.exe failed with args /c "/APK\gradle\rungradle.bat...

每日归档

更多

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)