Spark的shell界面操作

其他 2020-02-09 10:26:45 阅读次数: 0

目录

HADOOP和Spark生态圈

bin 目录下spark-shell 命令进入

Spark Shell 中算子的操作（转换算子和执行算子）

单节点基于standload的进入方式

单节点基于yarn调度的进入方式

HADOOP和Spark生态圈

bin 目录下spark-shell 命令进入

Spark Shell 中算子的操作（转换算子和执行算子）

Tansformation算子/函数延迟执行转换算子

1、map 窄依赖

2、filter 窄依赖

3、flatMap 窄依赖

4、coalesce (分区数,true) rdd7.partitions.size 查看rdd的分区数 val rdd5=rdd4.coalesce(3,true)

5、repartition (分区数) 不存在 shuffle val rdd5=rdd4.repartition(4)

6、groupByKey（） RDD[String,Iterable(Int)]

7、reduceBykey（_+_） val rdd8=rdd7.reduceByKey(_+_) 宽依赖

8、sortBykey（）根据K排序，要求RDD 中必须是KV的，宽依赖

9、sortBy（_._2,false）以value排序，进行倒序排序

10、coalesce 可以增加分区，可以减少分区，有shuffle 所以是宽依赖

repartition 可以增加分区，可以减少分区，有shuffle 所以是宽依赖分区

Action 立刻执行行动算子

1、collect

2、sum（）返回Double类型

3、rdd15.reduce(_+_) 返回的是int类型

4、rdd15.take（N）获取前N位

rdd1.takeOrdered(N) 升序排好序之后获取前N位

rdd1.top(N) 降序排好序之后获取前N位

rdd1.first 直接取出来首位

rdd1.count 查看rdd中有多少元素

单节点基于standload的进入方式

spark/bin 目录下 ./spark-shell 回车

单节点基于yarn调度的进入方式

spark/bin 目录下 spark-shell --master yarn-client 进yarn spark shell界面的

徐磊的博客

发布了50 篇原创文章 · 获赞 30 · 访问量 7032

私信关注

猜你喜欢

转载自blog.csdn.net/qq_44472134/article/details/104214391

Spark的shell界面操作

spark shell操作

spark-shell 高级操作

spark的shell命令操作(wordcount)

【Spark九十五】Spark Shell操作Spark SQL

使用spark-shell操作Carbondata

Spark Shell各种操作及详细说明

linux shell 操作 mysql命令（不进入mysql操作界面）

Spark shell

使用git bash 操作spark shell 无法删除

练习记录--总结Spark基础操作常用的Shell命令

spark-sql入门（一）通过spark-shell命令行操作

spark的UI界面解析

spark学习——spark shell学习

【Spark】Spark基本操作

spark shell的学习

Spark Shell简单使用

spark-shell解析

spark-shell

spark-shell 参数

spark shell hive sql

Spark shell交互

剖析Spark-Shell

Spark Shell笔记

Spark—Shell命令对WordCount案例的基本操作（统计、去重、排序、求平均值及join）

Spark UI界面实现原理

spark WebUI界面指标分析

shell 操作

Spark(2)SBT and Spark Shell in Quick Start

spark-shell启动spark报错

今日推荐

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

周排行

Java基础复习_day13_Collection集合

2018.11.16 c语言学习经验

且看Java内置四大核心函数式接口

小程序云开发中数据库的数据分段和显示图片

python的函数

Web-JS进阶

【干货】C++常用代码积累笔记大全

Spring的ioc操作与 IOC底层原理

构建之法20191121-11 Scrum立会报告+燃尽图 07

Spring boot之Hello World访问404

每日归档

更多

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)