Spark任务提交流程 - 代码天地

Spark任务提交流程

其他 2020-04-03 10:44:02 阅读次数: 0

standalone模式

spark-submit提交程序后，dirver和application向master注册
创建SparkContext对象，其中包含DAGScheduler和TaskScheduler
driver把application信息注册给master后，master会根据App信息去worker节点起executor
executor内部会创建运行Task的线程池，然后把启动的executor反向注册给driver
DAGScheduler负责把Spark作业转化成stage的DAG，根据宽窄依赖切分stage，然后把stage封装成TaskSet的形式发送给TaskScheduler，同时DAGScheduler还会处理由于shuffle数据丢失导致的失败
TaskScheduler维护所有的TaskSet，分发Task给各个节点的Executor，监控Task的运行状态，负责重试失败的Task
tak运行完成后，sparkContext向Master注销，释放资源

yarn-client模式

spark-submit在提交的时候发送给RM，请求启动ApplicationMaster（AM），分配一个container，在某个NodeManager（NM）启动AM，但是这里的AM只是一个ExecutorLancher，功能有限
AM启动后会找RM申请container，启动Executor，AM连接其他的NM，用container的资源来启动Executor，Executor会反向注册到本地的driver上
driver发送task给Executor，计算完成后，driver回收Executor的结果

yarn-cluster模式

由client向RM提交请求，并向HDFS上传jar包
ApplicationsMaster（AMST）向Scheduler申请空闲container
Scheduler向AMST返回空闲的container信息
RM根据返回的信息向NM申请资源
分配创建一个container并创建Spark Application Master （SAM）此时SAM上运行的是SparkDriver
SAM启动后，和RM通信，请求根据任务信息向RM申请container来启动executor
RM将申请到的资源信息返回给SAM
SAM根据返回的资源信息去请求对应的NM分配container来启动executor
NM收到请求会启动相应的container来启动executor
executor启动成功后向SAM反向注册
executor和SAM完成交互
后续的DAGScheduler，TaskScheduler，shuffle等操作和standalone模式一样
等到所有的任务执行完后，SAM向RM取消注册释放资源

发布了17 篇原创文章 · 获赞 4 · 访问量 467

私信关注

猜你喜欢

转载自blog.csdn.net/dhyaishuai/article/details/105142926

Spark任务提交流程

Spark 学习（二） spark任务提交流程

Spark提交流程

spark任务提交流程与管依赖和窄依赖

spark任务生成和提交流程详解

Spark集群任务提交流程----2.1.0源码解析

大数据学习(二十)spark任务提交流程+RDD

梳理spark提交流程

Flink——任务提交流程

Yarn 的任务提交流程

1.图解spark-standalone集群模式下spark任务提交流程分析

Spark（三）————作业提交流程

Spark源码剖析——SparkSubmit提交流程

Spark On YARN的作业提交流程

Hadoop Yarn架构及任务提交流程

MapReduce job任务源码提交流程

Spark-submit源码提交流程(spark版本2.2.0)

[3] -集群启动流程、任务提交流程以及checkpoint

Spark源码解析(五):Task提交流程

Spark job提交流程源代码分析

Spark集群的任务提交执行流程

Spark任务提交执行全流程详解

Spark任务提交方式和执行流程

JStorm源码分析(二)Storm任务提交流程

YARN的任务提交流程简述及图解

写给忙人看的Flink任务提交流程

flink yarn-perjob任务提交流程

第二天 -- Spark集群启动流程 -- 任务提交流程 -- RDD依赖关系 -- RDD缓存 -- 两个案例

Job提交流程

git提交流程

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

周排行

Python环境安装与基础语法（1）——计算机基础知识

IMU预积分

ADAS中的LDW、FCW、BSD、LCA、ACC、AEB、APA、DMS代表的含义

B站笔试两道题

skyeye arm 硬件虚拟机环境的搭建

Web前端静态页面示例

数组-合并排序数组 II-简单

springcloud之版本问题启动报错

面向对象-------------匿名对象(六)

输入URL到页面呈现中间发生了什么？

每日归档

更多

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)