spark分布式数据集RDD 的创建 - 代码天地

spark分布式数据集RDD 的创建

其他 2019-01-26 14:17:21 阅读次数: 0

1、启动spark

spark-shell --master local[2]

2、创建一个最简单的RDD

val rdd = sc.makeRDD(List(1,2,3,4,5));

3、查看RDD

rdd.collect()
返回
res0: Array[Int] = Array(1, 2, 3, 4, 5)

4、RDD指定分区(这样9个数据，就放在了3个分区中)

val rdd = sc.makeRDD(List(1,2,3,4,5,6,7,8,9),3)

5、查看分区的方法

执行以下代码，定义rddUtil

import org.apache.spark.rdd.RDD
import scala.reflect.ClassTag
object rddUtil {
  def lookPartition[T: ClassTag](rdd: RDD[T]) = {
    rdd.mapPartitionsWithIndex((i: Int, it: Iterator[T]) => {
      val partitionMap = scala.collection.mutable.Map[Int, List[T]]()
      var valueList = List[T]()
      while (it.hasNext) {
        valueList = valueList :+ it.next
      }
      partitionMap(i) = valueList
      partitionMap.iterator
    }).collect().foreach((partitionMap:(Int, List[T])) => {
      val partition = partitionMap._1
      println("partition:["+partition+"]")
      partitionMap._2.foreach {println(_) }
    })
  }
}

执行查看

 rddUtil.lookPartition(rdd)

partition:[0]
1
2
3
partition:[1]
4
5
6
partition:[2]
7
8
9

猜你喜欢

转载自blog.csdn.net/starkpan/article/details/86646981

spark分布式数据集RDD 的创建

Spark RDD：弹性分布式数据集

spark-RDD(弹性分布式数据集)

Spark学习之弹性分布式数据集RDD

【Spark】弹性分布式数据集RDD及其操作

Spark RDD基础实战(弹性分布式数据集)

Spark之RDD(弹性分布式数据集) 详解

Spark RDD弹性分布式数据集

弹性分布式数据集(RDD)

RDD（弹性分布式数据集）

【Spark】Spark核心之弹性分布式数据集RDD

Spark读取内存数据创建RDD

【spark】RDD创建

[Spark]-RDD之创建

[Spark] RDD的创建

Spark RDD创建操作

Spark之RDD的创建

【Spark】RDD创建总结

Spark之RDD创建

Spark RDD的创建

SparkRDD之弹性分布式数据集RDD

RDD（弹性分布式数据集）的分析

RDD弹性分布式数据集的基本操作

[2] - 弹性分布式数据集RDD

深入理解RDD弹性分布式数据集

RDD---弹性分布式数据集

Spark通过读文件构建DataFrame数据模型(java版)--RDD弹性分布式数据集

分布式数据（3）创建双向复本并同步

史上最简单的spark教程第五章-阶段性总结SparkJavaApi,RDD分布式数据集

Win10+Python3.6配置Spark创建分布式爬虫

今日推荐

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

周排行

[编程题]学英语

[codeforces 1288A] Deadline 约数+模

Python的web开发

Docker在Centos 7上的部署

python编码

解决Ubuntu16.04 fatal error: json/json.h: No such file or directory

mysql并发插入

rest接口如何适应jsonp的方案

linux 终端上网设置

高数——等号两边同时求导、积分的解释

每日归档

更多

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)