spark入门五（RDD高级算子二） - 代码天地

spark入门五（RDD高级算子二）

其他 2018-10-26 06:24:54 阅读次数: 0

1. 复习List的操作

list操作：

val ls1 = List(1)
val ls2 = List(2)
// 追加一个元素
ls1 :+ 2 这个结果为：res15: List[Any] = List(1, 2)
// 追加一个集合
ls1 ++ ls2 这个结果为：res16: List[Int] = List(1, 2)
// 追加一个集合
ls1 ::: ls2 这个结果为：res17: List[Int] = List(1, 2)

2. combineByKey

val rdd1 = sc.parallelize(List("dog","cat","gnu","salmon","rabbit","wolf","bear","bee"),3)

val rdd2 = sc.parallelize(List(1,2,1,2,1,2,1,2),3)

scala> val rdd3 = rdd2.zip(rdd1).collect
rdd3: Array[(Int, String)] = Array((1,dog), (2,cat), (1,gnu), (2,salmon), (1,rabbit), (2,wolf), (1,bear), (2,bee))


scala> val rdd3 = rdd2.zip(rdd1)
rdd3: org.apache.spark.rdd.RDD[(Int, String)] = ZippedPartitionsRDD2[5] at zip at <console>:27

scala> rdd3.combineByKey(List(_),(a:List[String],b:String)=> a :+ b,(x:List[String],y:List[String])=> x ::: y)
res21: org.apache.spark.rdd.RDD[(Int, List[String])] = ShuffledRDD[6] at combineByKey at <console>:26

scala> res21.collect
res22: Array[(Int, List[String])] = Array((1,List(gnu, rabbit, dog, bear)), (2,List(cat, wolf, bee, salmon)))

说明： List[String],b:String)=> a :+ b 作用是什么？

猜你喜欢

转载自blog.csdn.net/guo20082200/article/details/83150377

spark入门五（RDD高级算子二）

spark入门四（RDD高级算子一）

spark的RDD高级算子

Spark-RDD高级算子

spark RDD常用算子（二）

【Spark】（二）RDD和算子

Spark从入门到精通六------RDD的算子

spark笔记（二）之RDD常用算子

Spark高级算子练习（二）

Spark入门（五）：键值对RDD

spark RDD和RDD算子

Spark入门(四)——Spark RDD算子使用方法

2023_Spark_实验十一：RDD高级算子操作

Spark RDD 常用算子

spark的rdd算子

spark RDD算子大全

Spark-RDD算子

【Spark】RDD行动算子

spark之RDD算子

Spark的RDD行动算子

Spark RDD算子

spark RDD算子总结

Spark RDD算子实战

Spark算子--RDD的基本转换

Spark RDD常用算子整理

spark RDD常用算子（一）

spark RDD常用算子（三）

Spark算子：RDD创建的方式

Spark算子与RDD基本转换

Spark 之RDD算子的整理

今日推荐

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

周排行

[编程题]学英语

[codeforces 1288A] Deadline 约数+模

Python的web开发

Docker在Centos 7上的部署

python编码

解决Ubuntu16.04 fatal error: json/json.h: No such file or directory

mysql并发插入

rest接口如何适应jsonp的方案

linux 终端上网设置

高数——等号两边同时求导、积分的解释

每日归档

更多

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)