（RDD）Lineage 血缘关系和 Dependence 依赖关系 - 代码天地

（RDD）Lineage 血缘关系和 Dependence 依赖关系

其他 2018-05-31 12:06:56 阅读次数: 0

1）Lineage 说明

Lineage 保存了RDD的依赖关系

如：有这样的依赖关系：A =map=> B =filter=>C

假设B的RDD某个分区挂了，就可以通过血缘关系重新计算map的函数获取回来

即：一个RDD是如何从父RDD计算过来的

2）假如某RDD的分区是通过几个分区reducebykey算出来的，这时候得几个一起计算，如图：

3）Denpendence 两种介绍

Narrow 窄依赖：一个父RDD的partition至多被子RDD的某个partition使用一次，没有shuffle，容错和速度都很理想

Wide 宽依赖：一个父RDD的partition会被子RDD的某个partition使用多次，有shuffle，挂掉要重算，性能差很多

扫描二维码关注公众号，回复： 1245472 查看本文章

4）窄依赖

Q：Spark的join是窄依赖还是宽依赖？

A：join with inputs co-partitioned是窄依赖，其余都是宽依赖

5）宽依赖

Wide 会产生Shuffle ，只要n个有shuffle，都会被拆成n+1个stage

以下例子属于宽依赖：join / xxbykey（通过key分发都会产生shuffle）

6）stage图解，以下为通过两个shuffle最终有3个stage的案例

7）wordcount stage变化图解

猜你喜欢

转载自blog.csdn.net/qq_30130043/article/details/80318005

（RDD）Lineage 血缘关系和 Dependence 依赖关系

RDD血缘关系的追溯和持久化、checkPoint语法

Spark03-Spark运行过程剖析（基本运行流程， DAG，Lineage(血缘关系) 宽依赖和窄依赖）

RDD血缘关系源码详解！

使用Hive API分析HQL的执行计划、Job数量和表的血缘关系

牛津、剑桥、哈佛的血缘关系

图像溯源，图血缘关系总结

数据治理：数据血缘关系分析

2022数据血缘关系详解

数据治理：数据血缘关系！

设计模式中类的关系之依赖关系(Dependence)

Spark基础概念02-缓存机制、RDD血缘和依赖关系

SparkCore之RDD之间的依赖关系(血缘)详解

hive血缘关系之输入表与目标表的解析

数据仓库JOB血缘关系及调度器设计

基于spark logicplan的表血缘关系解析实现

基于MaxCompute InformationSchema进行血缘关系分析

基于MaxCompute InformationSchema进行表血缘关系分析

数仓血缘关系数据的存储与读写

RDD的依赖关系

RDD依赖关系与DAG

Spark——RDD 依赖关系

RDD的依赖关系(重要)

Spark的RDD依赖关系

Spark(27)-RDD依赖关系和运行过程

RDD中的依赖关系，宽依赖和窄依赖，容易理解~

Spark Core快速入门系列(3) | RDD的依赖关系(宽依赖和窄依赖)

spark --RDD宽窄依赖关系

SparkCore之RDD依赖关系

RDD的分区、依赖关系、机制

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

基本数据类型封装类比较 Java源码解读(一) 8种基本类型对应的封装类型

JS实现无缝滚动上

深入解析HashMap原理（基于JDK1.8）

mysql的连接池

关于.htc

linux下的ubuntu12.04图形界面

【数论】好推不好记的扩展欧几里德

设备树详解

cscope + tags 简单设置

xml学习

每日归档

更多

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)