SPARK转换算子简单的实现示例（map,filter,flatmap,groupByKey） - 代码天地

SPARK转换算子简单的实现示例（map,filter,flatmap,groupByKey）

其他 2018-05-08 23:00:00 阅读次数: 2

package day05
import org.apache.spark.rdd.RDD
import org.apache.spark.{SparkConf, SparkContext}

class MyTransformation_scala {

  //使用map对集合中的每一个元素乘 2
  def myMap(sc: SparkContext): Unit ={
    val array: Array[Int] = Array(1,2,3,4,5,6,7,8,9)
    val pRdd: RDD[Int] = sc.parallelize(array)
    val mapRDD: RDD[Int] = pRdd.map(_ * 2)
    mapRDD.collect()
    println(mapRDD.collect().toList.toString)
  }

  //过滤整型集合中出现的奇数 保留偶数
  def myFilter(sc: SparkContext): Unit ={
    val array: Array[Int] = Array(1,2,3,4,5,6,7,8,9)
    val pRdd: RDD[Int] = sc.parallelize(array)
    val filterRDD: RDD[Int] = pRdd.filter(_ % 2 == 0)
    println(filterRDD.collect().toList.toString())
  }
  //将多维的集合压扁成一维的
  def myFlatMap(sc : SparkContext){
    val array: Array[String] =
      Array("Hello World" , "Hello scala" , "Hello Java")
    val parallelizeRDD: RDD[String] = sc.parallelize(array)
    val flatMapRDD: RDD[String] = parallelizeRDD.flatMap(_.split(" "))
    println(flatMapRDD.collect().toList.toString())
  }

  //按照key分组
  def myGroupByKey(sc : SparkContext): Unit ={
    val array: Array[(String, Int)] = Array(Tuple2("class1",80),
      Tuple2("class2",60),Tuple2("class1",75),Tuple2("class2",92))
    val parallelizeRDD: RDD[(String, Int)] = sc.parallelize(array)
    val groupByKeyRDD: RDD[(String, Iterable[Int])] =
      parallelizeRDD.groupByKey()
    println(groupByKeyRDD.collect().toList.toString())
  }
}


object MyTransformation_scala{
  val tfs: MyTransformation_scala = new MyTransformation_scala
  def main(args: Array[String]) {
    val conf =  new SparkConf().
      setMaster("local").setAppName("MyTransformation_scala")
    val sc: SparkContext = new SparkContext(conf)
    //    tfs.myMap(sc)
    //    tfs.myFilter(sc)
    //    tfs.myFlatMap(sc)
    tfs.myGroupByKey(sc)
    sc.stop()
  }
}

猜你喜欢

转载自blog.csdn.net/wjn19921104/article/details/80230431

SPARK转换算子简单的实现示例（map,filter,flatmap,groupByKey）

Flink之基本转换算子（map/flatMap/filter）

Flink 基本转换算子（Transformation） Map Filter FlatMap

10.3 spark算子例子map,filter,flatMap,mapPartitions,groupByKey,join,distinct

(一)Spark常用算子：map，mapPartition，mapPartitionIndex，flatMap，filter

Spark算子之map、flatMap

Spark算子：RDD基本转换操作(1)–map、flatMap、distinct

Spark算子系列文章------------Spark算子：RDD基本转换操作(1)–map、flatMap、distinct

Value类型RDD转换算子（一）——map、mapPartitions、mapPartitionsWithIndex、flatMap、glom、groupBy

spark部分：map，flatmap，mapPartitions,mapPartitionswithindex算子

用JAVA简单实现Spark转换算子实例（reduceByKey,sortByKey,join,cogroup）

spark的转换算子2

Spark的RDD转换算子

java实现spark常用算子之groupbykey

Spark之RDD算子-转换算子

spark转换算子求交集SCALA实现（insertsection）

spark转换算子求交集JAVA实现(intersection)

【Spark】Spark 转换算子详解

Spark RDD算子整理 -- 转换算子行动算子

Spark算子：transformation之键值转换groupByKey、reduceByKey、reduceByKeyLocally

java spark转换算子sortByKey

spark中的转换算子1

Spark RDD常用转换算子

Spark的flatmap与map.filter.map有什么异同

Spark算子groupbykey与reducebykey区别

spark基本函数- RDD转换算子和行动算子

Key-Value类型RDD转换算子1——partitionBy、groupByKey & reduceByKey、aggregateByKey & foldByKey & combineByKey

【Spark】Spark groupByKey，reduceByKey，sortByKey 算子比较

Spark：map与flatMap区别

Spark中map与flatMap

今日推荐

数学建模Matlab之数据预处理方法

充电桩---ISO15118协议详细介绍

对话Kaldi之父、小米首席语音科学家Daniel Povey：开源环境比金钱和荣誉更吸引我 | AGI技术50人...

Hugging Face全攻略：轻松下载Llama 3模型，探索NLP的无限可能！【实操】

阅读送书抽奖？玩转抽奖游戏，js-tool-big-box工具库新上抽奖功能

百度发布Comate代码知识增强2.0，国内首个支持实时检索智能代码助手

黑客利用扫雷游戏 Python 克隆隐藏恶意脚本，攻击欧洲和美国金融机构

微软对开源字体 Cascadia Code 进行重大更新

好书推荐《ChatGPT原理与架构：大模型的预训练、迁移和中间件编程》

Baidu Comate 智能编码助手：编程新伙伴，效率新飞跃

AI时代：人工智能大模型引领科技创造新时代

百篇博客 · 千里之行

周排行

Python模块之shelve

勇于承担责任

Hikyuu 1.1.0 发布，量化交易研究框架

字节跳动Java3面“凉凉”~不负韶华，努力复习备战“金三银四”

Linux下静态链接库与动态链接库的区别

spring boot架构改造

怎么理解AOP

文件不同步 --本地和eclipse

在linux配置nginx负载均衡

Linux Shell基础命令

每日归档

更多

2024-05-28(2)

2024-05-27(56)

2024-05-26(6)

2024-05-25(68)

2024-05-24(65)

2024-05-23(9)

2024-05-22(41)

2024-05-21(8)

2024-05-20(36)

2024-05-19(0)