Spark PruneDependency 依赖关系 RangePartitioner

编程语言 2018-12-05 21:34:39 阅读次数: 0

Spark PruneDependency 依赖关系 RangePartitioner

Represents a dependency between the PartitionPruningRDD and its parent. In this
case, the child RDD contains a subset of partitions of the parents’.

更多资源

github: https://github.com/opensourceteams/spark-scala-maven
csdn(汇总视频在线看): https://blog.csdn.net/thinktothings/article/details/84726769

youtub视频演示

https://youtu.be/YRQ6OaOXmPY (youtube视频)
https://www.bilibili.com/video/av37442139/?p=4 (bilibile视频)

输入数据

List(("a",2),("d",1),("b",8),("d",3)

处理程序scala


package com.opensource.bigdata.spark.local.rdd.operation.dependency.narrow.n_03_pruneDependency.n_02_filterByRange

import com.opensource.bigdata.spark.local.rdd.operation.base.BaseScalaSparkContext

object Run  extends BaseScalaSparkContext{

  def main(args: Array[String]): Unit = {

    val sc = pre()
    val rdd1 = sc.parallelize(List(("a",2),("d",1),("b",8),("d",3)),2)  //ParallelCollectionRDD
    val rdd1Sort = rdd1.sortByKey()   //ShuffleRDD
    val rdd2 =rdd1Sort.filterByRange("a","b")  //MapParttionsRDD

    println("rdd \n" + rdd2.collect().mkString("\n"))

    sc.stop()
  }

}

数据处理图

猜你喜欢

转载自blog.csdn.net/thinktothings/article/details/84831866

Spark PruneDependency 依赖关系 RangePartitioner

Spark PruneDependency 依赖关系 Filter

Spark分区器HashPartitioner和RangePartitioner

Spark Core快速入门系列(8) | HashPartitioner和RangePartitioner

spark的分区器hashpartitioner、RangePartitioner，分布式排序原理

Spark分区器HashPartitioner和RangePartitioner代码详解

Spark——RDD 依赖关系

Spark的RDD依赖关系

Spark RDD算子之分区操作 -- HashPartitioner、RangePartitioner、自定义分区

Spark RangeDependency 区间依赖关系

Spark06--依赖关系

spark --RDD宽窄依赖关系

spark RDD 之间得依赖关系

spark笔记之RDD的依赖关系

Spark算子总结，RDD类型，依赖关系

Spark_RDD宽窄依赖关系

Spark_RDD宽窄依赖关系

Spark2.3.2源码解析： 5. RDD 依赖关系：宽依赖与窄依赖

Spark Core快速入门系列(3) | RDD的依赖关系(宽依赖和窄依赖)

spark（13）-RDD的依赖关系（corse22）

Spark之RDD依赖关系及DAG逻辑视图

Spark的RDD函数传递、依赖关系、缓存及CheckPoint

Spark Core快速入门系列(6) | RDD的依赖关系

Spark-序列化、依赖关系、持久化

IDEA增加Spark依赖关系及其简单使用-词频统计

Spark(27)-RDD依赖关系和运行过程

SPARK 宽依赖和窄依赖 transfer action lazy策略之间的关系

Spark之SparkCore:RDD-数据核心/API【依赖关系：宽窄依赖】

spark task、job、partition之间的关系宽窄依赖 spark任务调度

Spark03-Spark运行过程剖析（基本运行流程， DAG，Lineage(血缘关系) 宽依赖和窄依赖）

今日推荐

技术解析 GPT-4o：即时语音交互的突破与 GenAI 发展策略

开源大模型与闭源大模型

微信小程序授权登录获取用户的openid

亿级流量系统架构设计与实战

人工智能时代的程序设计教学与课程设计

纽交所技术问题致伯克希尔 (BRK.A) 显示跌近 100%

周排行

《Python 编程-从入门到实践》11-1~11-3

关于Numpy+TensorFlow+PyTorch构造NN的总结

【原创达人】制作WINPE启动盘心得

英文图片文字识别（提取）

2022cma看片网站给一个你懂的

二叉搜索树的实现（BST）（插入+删除+查找+各种遍历+高度）

搬家通知博文地址(将博客搬到CSDN)

asfd

解决错误：MISCONF Redis is configured to save RDB snapshots, but is currently not able to persist on disk

如何注册微信个人小程序

每日归档

更多

2024-06-08(0)

2024-06-07(0)

2024-06-06(0)

2024-06-05(0)

2024-06-04(10)

2024-06-03(52)

2024-06-02(4)

2024-06-01(60)

2024-05-31(47)

2024-05-30(4)