Spark面试：Spark on yarn 运行流程 - 代码天地

Spark面试：Spark on yarn 运行流程

编程语言 2018-12-25 18:16:17 阅读次数: 0

一：
Spark on YARN能让Spark计算模型在云梯YARN集群上运行，直接读取云梯上的数据，并充分享受云梯YARN集群丰富的计算资源。
二：
基于YARN的Spark作业首先由客户端生成作业信息，提交给ResourceManager，
ResourceManager在某一 NodeManager汇报时把AppMaster分配给NodeManager，
NodeManager启动 SparkAppMaster，SparkAppMaster启动后初始化作业，
向ResourceManager申请资源，申请到相应资源后 SparkAppMaster通过RPC让NodeManager启动相应的SparkExecutor，
SparkExecutor向 SparkAppMaster汇报并完成相应的任务
SparkClient会通过AppMaster获取作业运行状态。
三：
driver 运行在集群中（cluster模式）
1、client 向 yarn 提交一个job
2、ResouceManager 为该job在某个 NodeManager 上分配一个 ApplicationMaster，NM启动AppMaster，Appmaster 启动 driver
3、ApplicationMaster 启动后完成初始化作业，driver 生成一系列task
4、AM 向 RM 申请资源，RM 返回 Executo r信息
5、AM 通过 rpc 启动相应的 sparkExecutor
6、Driver 向 Executor 分配 task
7、Executor 执行结果写入文件或返回 driver 端

在这里插入图片描述

四：
driver运行在client端
1、客户端启动后直接运行应用程序，直接启动 driver
2、driver 初始化并生成一系列 task
3、客户端将 job 发布到 yarn 上
4、RM 为该job 在某个 NM 分配一个 AM
5、AM 向 RM 申请资源，RM 返回Executor 信息
6、AM 通过 RPC 启动相应的 SparkExecutor
7、Driver 向 Executor 分配 task
8、Executor 执行task 并将结果写入第三方存储系统或者 Driver 端

在这里插入图片描述

五：对比总图

在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/qq_43688472/article/details/85246304

Spark面试：Spark on yarn 运行流程

Spark Yarn Client模式运行流程

Spark Yarn Cluster模式运行流程

Spark on Yarn的运行原理

Spark On Yarn 运行模式

Spark 在YARN上运行

Spark On Yarn 详细配置流程

Spark运行模式之Spark on Yarn

Spark-on-YARN运行Spark程序

在YARN上运行Spark API

浅谈Spark On Yarn运行原理

Spark On YARN的作业提交流程

GeoSpark测试--以Spark yarn模式运行

spark运行模式 standlone mesos yarn

Spark运行模式之Yarn模式

Spark On Yarn搭建及各运行模式说明

Spark之Yarn Cluster运行机制

Spark运行模式之Yarn模式详解

WordCount提交到Spark-Yarn运行

YARN回顾（七）——Spark在YARN上的运行模式

yarn spark

Spark On Yarn

Spark on YARN - Clinet模式运行spark报错问题

Spark----【spark on yarn】

Spark（五十一）：Spark On YARN（Yarn-Cluster模式）启动流程源码分析（二） Spark（四十九）：Spark On YARN启动流程源码分析（一）

用spark写WordCount(本地运行，提交到yarn运行)

Spark的分布式运行模式 Local，Standalone, Spark on Mesos, Spark on Yarn, Kubernetes

Yarn运行流程

Spark基本工作流程及YARN cluster模式原理

[Spark内核]Yarn集群模式部署流程源码分析

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

NEFU 117 素数个数的位数

Closest Common Ancestors (Lca,tarjan)

ELK部署

【转载】Hive笔记整理（三）

SQL语句（一）基本表的定义

关于Java web开发中的MySQL的事务语句

MFC创建自定义窗体

如何用一句话激怒程序员？

《逆袭大学》文摘——9.4 基础和应用的平衡中找到大学的节奏

【spring源码分析】@Value注解原理

每日归档

更多

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)