Spark 什么是DAG（有向无环图）（窄依赖和宽依赖） - 代码天地

Spark 什么是DAG（有向无环图）（窄依赖和宽依赖）

编程语言 2018-05-10 08:46:14 阅读次数: 0

在Spark里每一个操作生成一个RDD，RDD之间连一条边， 最后这些RDD和他们之间的边组成一个有向无环图，这个就是DAG。

在spark的应用
Spark内核会在 需要计算发生的时刻绘制一张关于计算路径的有向无环图，也就是DAG。
有了计算的DAG图，Spark内核下一步的任务就是根据DAG图将计算划分成任务集，也就是Stage，这样可以将任务提交到计算节点进行真正的计算。Spark计算的中间结果默认是保存在内存中的，Spark在划分Stage的时候会充分考虑在分布式计算中可流水线计算（pipeline）的部分来提高计算的效率，而在这个过程中，主要的根据就是RDD的依赖类型。根据不同的transformation操作，RDD的依赖可以分为窄依赖（Narrow Dependency）和宽依赖（Wide Dependency，在代码中为ShuffleDependency）两种类型。

窄依赖指的是生成的RDD中每个partition只依赖于父RDD(s) 固定的partition。
宽依赖指的是生成的RDD的每一个partition都依赖于父 RDD(s) 所有partition。

窄依赖典型的操作有map, filter, union等
宽依赖典型的操作有groupByKey, sortByKey等。

可以看到，宽依赖往往意味着shuffle操作，这也是Spark划分stage的主要边界。对于窄依赖，Spark会将其尽量划分在同一个stage中，因为它们可以进行流水线计算。
至于以上一些shuffer过程建议大家多看看spark官网会比较好点

转自： http://blog.csdn.net/sinat_31726559/article/details/51738155

猜你喜欢

转载自forlan.iteye.com/blog/2376553

Spark 什么是DAG（有向无环图）（窄依赖和宽依赖）

spark - 宽依赖和窄依赖

Spark 中的宽依赖和窄依赖

spark窄依赖和宽依赖

Spark中的宽依赖和窄依赖

Spark：宽依赖和窄依赖

spark宽依赖与窄依赖

Spark - 宽依赖 & 窄依赖

spark学习系列——10 spark宽依赖和窄依赖

Spark03-Spark运行过程剖析（基本运行流程， DAG，Lineage(血缘关系) 宽依赖和窄依赖）

【Spark练习】宽、窄依赖

Spark的有向无环图DAG(代码及图解)

Apache Spark中的有向无环图DAG

spark rdd之间的宽依赖和窄依赖

spark 中宽依赖和窄依赖的区别及优缺点

聊聊Spark中的宽依赖和窄依赖

Spark _08窄依赖和宽依赖&stage

Spark:宽依赖与窄依赖深度剖析

小记--------spark的宽依赖与窄依赖分析

Spark内核源码深度剖析（1） - Spark整体流程和宽依赖和窄依赖

Spark系列——RDD的宽依赖和窄依赖，以及Spark的运行架构，运行流程，框架的特点

Spark Core快速入门系列(3) | RDD的依赖关系(宽依赖和窄依赖)

大数据学习 Spark：有向无环图（DAG）检测

Spark 的join 什么时候是宽依赖什么时候是窄依赖

Spark宽依赖窄依赖 Job Stage Executor Task 总结

SPARK 宽依赖和窄依赖 transfer action lazy策略之间的关系

Spark_Spark 中的宽窄依赖每次进步一点点——Spark 中的宽依赖和窄依赖

spark任务提交流程与管依赖和窄依赖

Spark2.3.2源码解析： 5. RDD 依赖关系：宽依赖与窄依赖

跟我一起学Spark之——RDD Join中宽依赖与窄依赖的判断

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

让自己的头脑极度开放

CentOS 6.5(x64) 和Redhat6.5操作系误删libc

高可用注册中心

【日记】12.28/【题解】AtCoder AGC041

XML（5）_XML 约束_DTD

Java集合Map（四）

树梅派安装桌面环境教程

pipenv 的使用和安装

小程序白屏问题和内存研究

C语言简单选择排序

每日归档

更多

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)