SPARK算子实例SCALA实现（take,SavaASTextFile,CountByKey） - 代码天地

SPARK算子实例SCALA实现（take,SavaASTextFile,CountByKey）

其他 2018-05-08 23:00:00 阅读次数: 3

package day06
import org.apache.spark.{SparkConf, SparkContext}
import org.apache.spark.rdd.RDD
import scala.collection.Map

object MyAction_Scala_2 {
   def myTake(sc:SparkContext){
     val RDD1 = sc.parallelize(List("aa", "bb", "cc"))
  val array: Array[String] = RDD1.take(2)
    array.toList.toString
   }


  def mySaveASTextFile(sc:SparkContext): String ={
    val parallelizeRDD:RDD[String]=sc.parallelize(List("hello world","hello scala"))
    val flatMapRDD:RDD[String]=parallelizeRDD.flatMap(_.split(" "))
  //flatMapRDD.saveAsTextFile("D://3.txt")
    flatMapRDD.saveAsTextFile("hdfs://hadoop-1707-001:9000/save/test000")
    "保存成功"
  }
  //统计集合key出现的次数
  def myCountByKey(sc:SparkContext): Unit ={
    var array: Array[(String, String)] = Array(Tuple2("class2","liao"),Tuple2("class2","ao"),Tuple2("class2","li"),Tuple2("class1","lao"))
     var parallelizeRDD: RDD[(String, String)] = sc.parallelize(array)
      var countByKeyRDD: Map[String, Long] = parallelizeRDD.countByKey()
        for((k,v)<-countByKeyRDD){
          println("key="+k,"value="+v)
        }

  }

  def main(args: Array[String]) {
    val conf: SparkConf = new SparkConf().setMaster("local").setAppName("MyAction_scala_2")
    var sc: SparkContext = new SparkContext(conf)
    myCountByKey(sc)
    // myTake(sc)
    //mySaveASTextFile(sc)
   sc.stop()
  }
}

猜你喜欢

转载自blog.csdn.net/wjn19921104/article/details/80230283

SPARK算子实例SCALA实现（take,SavaASTextFile,CountByKey）

SPARK算子实例JAVA实现（take,CountByKey,SaveAsTextFile）

spark 算子实例

SPARK算子实例JAVA实现（reduce）

Spark RDD 常用算子实例解析

spark算子实现词频统计（java版和scala版）

spark：distinct算子实现原理

java实现spark常用算子之Take

用JAVA简单实现Spark转换算子实例（reduceByKey,sortByKey,join,cogroup）

spark中的算子（ mapPartitionsWithIndex ，coalesce，zipWithIndex，zip，countByKey，countByValue，reduce等）【Scala】

Spark中countByKey算子详解介绍

spark通过combineByKey算子实现条件性聚合的方法

Spark RDD算子实战

Spark RDD算子之PairRDD的Action操作 -- countByKey、collectAsMap

Spark RDD算子实例——统计广告点击量 Top3

大数据：wordcount案例RDD编程算子，countByKey，reduce，fold，first，take，top，count，takeSample，takeOrdered

Spark : Scala算子分类

Spark-Scala算子

spark使用状态函数updateStateByKey算子实现数据入库

RDD算子实现文件统计

spark转换算子求交集SCALA实现（insertsection）

Spark算子：RDD行动Action操作(2)–take、top、takeOrdered

Spark core算子aggregateByKey实例

Opencv之利用matchshape算子实现简单的形状匹配

构建高效物理计划：从逻辑查询到算子实现

使用opencv的Sobel算子实现图像边缘检测

使用opencv的Laplacian算子实现图像边缘检测

Spark常用transformation算子操作 —— Scala版

Spark常用action算子操作 —— Scala版

Spark ML 特征转换及处理算子实战技巧-Spark商业ML实战

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

循环神经网络（rnn）讲解

Tigao教程四：单独的关节运动

金蝶K3WISE15.0-注册套打教程

如何在Mac上配置Kubernetes

Android应用结束自身进程的方法

SpringMVC学习十三拦截器栈

中国驻洛杉矶总领馆举行新春招待会

HttpClient get post 发送

11 - three.js 笔记 - 绘制三维字体模型

Mysql递归获取某个父节点下面的所有子节点和子节点上的所有父节点

每日归档

更多

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)