spark笔记之Spark任务调度 - 代码天地

spark笔记之Spark任务调度

企业开发 2018-08-14 11:18:27 阅读次数: 0

9.1 任务调度流程图
spark笔记之Spark任务调度
各个RDD之间存在着依赖关系，这些依赖关系就形成有向无环图DAG，DAGScheduler对这些依赖关系形成的DAG进行Stage划分，划分的规则很简单，从后往前回溯，遇到窄依赖加入本stage，遇见宽依赖进行Stage切分。完成了Stage的划分。DAGScheduler基于每个Stage生成TaskSet,并将TaskSet提交给TaskScheduler。TaskScheduler 负责具体的task调度,最后在Worker节点上启动task。
9.2 DAGScheduler
（1）DAGScheduler对DAG有向无环图进行Stage划分。
（2）记录哪个RDD或者 Stage 输出被物化（缓存），通常在一个复杂的shuffle之后，通常物化一下(cache、persist)，方便之后的计算。
（3）重新提交shuffle输出丢失的stage（stage内部计算出错）给TaskScheduler
（4）将 Taskset 传给底层调度器
a）– spark-cluster TaskScheduler
b）– yarn-cluster YarnClusterScheduler
c）– yarn-client YarnClientClusterScheduler
9.3 TaskScheduler
（1）为每一个TaskSet构建一个TaskSetManager 实例管理这个TaskSet 的生命周期
（2）数据本地性决定每个Task最佳位置
（3）提交 taskset( 一组task) 到集群运行并监控
（4）推测执行，碰到计算缓慢任务需要放到别的节点上重试
（5）重新提交Shuffle输出丢失的Stage给DAGScheduler

猜你喜欢

转载自blog.51cto.com/13587708/2159591

spark笔记之Spark任务调度

spark之任务调度DagScheduler&TaskScheduler

Spark任务调度初识

Spark任务调度

Spark-任务调度

spark的任务调度模式

spark任务调度原理

Spark的任务调度

spark的资源调度与任务调度

（六）Spark学习笔记之调度

【Spark-core学习之六】 Spark资源调度和任务调度

使用Azkaban调度Spark任务

spark任务调度——梳理龙骨

Spark资源调度和任务调度

Spark-任务调度与资源调度的整合

Spark资源调度和任务调度流程

Spark任务调度流程及调度策略分析

Spark _09资源调度和任务调度

Spark资源调度与任务调度（standalone模式）

关于Spark的资源调度和任务调度

spark笔记（一）之RDD任务划分

Spark大数据处理讲课笔记3.7 Spark任务调度

Spark内核解析之(5)Spark 任务调度原理机制深度剖析

Spark内核之DAGScheduler调度

spark笔记之Spark SQL

Spark中的核心概念和任务调度

Spark TaskSchedulerImpl 任务调度方式(FIFO)

spark任务调度FIFO和FAIR的详解

spark任务调度模式，动态资源分配

26_spark四—任务调度

今日推荐

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

周排行

static方法和非static方法的区别（java）

如何查找计算机专业paper

java.lang.ClassFormatError: Incompatible magic value 0 in class file com/sitecha

跳跃游戏II

stm32_之【建立工程】

TeaWeb v0.0.9 发布，统计底层优化、主机监控功能改进

事件分发 -----控制字体大小

JavaScript DOM练习（动态表格添加） December 25，2019

JSF Scope & CDI

实现从零搭建一个登录注册页面（附源代码）

每日归档

更多

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)