Spark 内核

其他 2020-06-28 11:58:10 阅读次数: 0

Spark内核

Spark内核泛指Spark的核心运行机制，包括Spark核心组件的运行机制、Spark任务调度机制、Spark内存管理机制、Spark核心功能的运行原理等。

Spark核心组件

Driver

Spark驱动器节点，用于执行Spark任务中的main方法：

将用户程序转化为作业（job）；
在Executor之间调度任务(task)；
跟踪Executor的执行情况；
通过UI展示查询运行情况；

Executor

Spark Executor节点是一个JVM进程，负责在 Spark 作业中运行具体任务，任务彼此之间相互独立。Spark 应用启动时，Executor节点被同时启动，并且始终伴随着整个 Spark 应用的生命周期而存在。如果有Executor节点发生了故障或崩溃，Spark 应用也可以继续执行，会将出错节点上的任务调度到其他Executor节点上继续运行。
Executor两个核心功能：

负责运行组成Spark应用的任务，并将结果返回给驱动器进程；
它们通过自身的块管理器（Block Manager）为用户程序中要求缓存的 RDD 提供内存式存储。RDD 是直接缓存在Executor进程内的，因此任务可以在运行时充分利用缓存数据加速运算。

Spark核心运行流程

任务提交-Driver进程-集群管理器-分配Executor并启动-Driver所需资源满足-main函数（懒执行）-action算子-反向推算-根据宽依赖划分stage-每一个stage对应一个taskset(中有多个task)–分发task到指定的Executor执行(本地化原则)-Executor不断与Driver通信，报告任务运行情况。

猜你喜欢

转载自blog.csdn.net/gracejpw/article/details/105112493

Spark内核

Spark 内核

【Spark 内核】 Spark 内核解析-上

【Spark 内核】 Spark 内核解析-下

10.1 spark core — spark内核

Spark学习之Spark内核

Spark内核深度剖析

Spark内核架构

[spark内核]shuffle机制

Spark 内核解析

Spark内核概述

Spark内核架构剖析

Spark 详细内核概述

Spark内核解析

spark内核源码

【Spark二四】Spark内核源码剖析

【Spark内核源码】Spark源码环境搭建

【Spark内核源码】Spark执行环境，SparkEnv

Spark之Spark内核工作流程

Spark实战（2）_Spark内核架构剖析

Spark内核详解 (7) | Spark 内存管理

Spark内核详解 (6) | Spark Shuffle 解析

Spark内核详解 (4) | Spark 部署模式

Spark内核详解 (1) | Spark内核的简要概述

Spark内核架构深度剖析

深入剖析 Spark 内核（一）

Spark:内核架构深度剖析

Spark之SparkSQL内核解析

Spark之SparkContext内核解析

Spark之TaskScheduler内核解析

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)