Spark Core快速入门系列(3) | RDD的依赖关系(宽依赖和窄依赖) - 代码天地

Spark Core快速入门系列(3) | RDD的依赖关系(宽依赖和窄依赖)

其他 2020-09-08 19:49:32 阅读次数: 0

目录

查看RDD的血缘关系
查看RDD的依赖关系
窄依赖
宽依赖

查看RDD的血缘关系

在这里插入图片描述

查看RDD的依赖关系

在这里插入图片描述

窄依赖

窄依赖相当于OneToOne
如果 B RDD 是由 A RDD 计算得到的, 则 B RDD 就是 Child RDD, A RDD 就是 parent RDD.
如果依赖关系在设计的时候就可以确定, 而不需要考虑父 RDD 分区中的记录, 并且如果父 RDD 中的每个分区最多只有一个子分区, 这样的依赖就叫窄依赖
一句话总结: 父 RDD 的每个分区最多被一个子RDD 的分区使用
在这里插入图片描述
具体来说, 窄依赖的时候, 子 RDD 中的分区要么只依赖一个父 RDD 中的一个分区(比如map, filter操作), 要么在设计时候就能确定子 RDD 是父 RDD 的一个子集(比如: coalesce).
所以, 窄依赖的转换可以在任何的的一个分区上单独执行, 而不需要其他分区的任何信息.

宽依赖

宽依赖相当于shuffle依赖
如果父 RDD 的分区被不止一个子 RDD 的分区依赖, 就是宽依赖.
在这里插入图片描述
宽依赖工作的时候, 不能随意在某些记录上运行, 而是需要使用特殊的方式(比如按照 key)来获取分区中的所有数据.
例如: 在排序(sort)的时候, 数据必须被分区, 同样范围的 key 必须在同一个分区内. 具有宽依赖的 transformations 包括: sort, reduceByKey, groupByKey, join, 和调用rePartition函数的任何操作.

猜你喜欢

转载自blog.csdn.net/qq_46548855/article/details/108046325

Spark Core快速入门系列(3) | RDD的依赖关系(宽依赖和窄依赖)

Spark系列——RDD的宽依赖和窄依赖，以及Spark的运行架构，运行流程，框架的特点

spark学习系列——10 spark宽依赖和窄依赖

spark rdd之间的宽依赖和窄依赖

Spark Core快速入门系列(6) | RDD的依赖关系

Spark2.3.2源码解析： 5. RDD 依赖关系：宽依赖与窄依赖

spark - 宽依赖和窄依赖

Spark 中的宽依赖和窄依赖

spark窄依赖和宽依赖

Spark中的宽依赖和窄依赖

Spark：宽依赖和窄依赖

spark宽依赖与窄依赖

Spark - 宽依赖 & 窄依赖

【Spark练习】宽、窄依赖

spark 中宽依赖和窄依赖的区别及优缺点

聊聊Spark中的宽依赖和窄依赖

Spark _08窄依赖和宽依赖&stage

SPARK 宽依赖和窄依赖 transfer action lazy策略之间的关系

Spark:宽依赖与窄依赖深度剖析

小记--------spark的宽依赖与窄依赖分析

Spark——RDD 依赖关系

Spark的RDD依赖关系

Spark03-Spark运行过程剖析（基本运行流程， DAG，Lineage(血缘关系) 宽依赖和窄依赖）

跟我一起学Spark之——RDD Join中宽依赖与窄依赖的判断

Spark内核源码深度剖析（1） - Spark整体流程和宽依赖和窄依赖

Spark学习--3、WordCount案例、RDD序列化、RDD依赖关系、RDD持久化

Spark宽依赖窄依赖 Job Stage Executor Task 总结

spark --RDD宽窄依赖关系

Spark基础入门（二）--------DAG与RDD依赖

Spark 什么是DAG（有向无环图）（窄依赖和宽依赖）

今日推荐

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

“百模大战”必有一战 | 2024中国“百模大战”竞争格局分析

周排行

Family Tree 题解

BZOJ 1093 最大半连通子图 SCC + DP

幂等处理

Spring----学习（2）----XML 配置Bean 自动装配

SQL Server 远程更新目标表数据

HIbernate3.6 环境搭建

特殊符号正则表达式

【Linux】第一章进程的理解

843. n-皇后问题（dfs+输出各种情况）

空间数据库2

每日归档

更多

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)

2024-04-17(5)