3-spark学习笔记-SparkAPI

其他 2019-06-30 09:21:59 阅读次数: 0

API详解如下所示:

具体操作如下所示:

Transformer操作:

1、Map

2、filter

3、flatMap

4、mapPartitions

5、mapPartitionsWithIndex

6、repartition (数据分配不均、性能扩展比较慢，需要repartition 比较消耗资源，进行shuffle操作)

7、coalesce (减少partition操作不做shuffle 性能更快速一些 shuffle = false)

8、union

9、join

10、intersection -交集可以用来算留存

11、cogroup

12、groupBy

13、groupByKey

14、reduceBykey

15、sample // false 不放回抽样 true放回抽样

16、cartesian 笛卡尔积

17、pipe //执行上面执行一个shell 命令

18、textFile

val inputRdd = sparkContext.textFile("file_path")

inputRdd.foreach(println(_))

inputRdd.map(_.length).saveAsTextFile("file_path")

Action:

collect、take、first、takesample等等

猜你喜欢

转载自blog.csdn.net/weixin_41362649/article/details/90748270

3-spark学习笔记-SparkAPI

培训系列3-SPARK RDD filter 以及 filter 函数

spark学习笔记3

spark 学习笔记3

spark学习笔记（3）

[3].Spark 学习笔记使用java ---explode

spark 2.2.0学习笔记3之SparkRDDDemo

Spark学习笔记(3)SparkContext源码

Spark学习笔记：（3、键值对操作）

spark学习笔记：Spark Streaming

Spark学习笔记： Spark Streaming

Spark学习笔记：Spark SQL

spark笔记3

Spark大数据学习笔记_第3篇_Hive的安装

2020寒假学习进度笔记3：Spark安装

Spark学习（3）RDD

spark 学习3

spark学习笔记01

spark学习笔记二

Spark 学习笔记

Spark学习笔记

spark学习笔记5

spark学习笔记2

spark学习笔记1

spark学习笔记6

spark学习笔记4

Spark学习笔记（一）

Spark RDD学习笔记

学习笔记-Spark

spark学习笔记_1

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)