Spark入门（一）--用Spark-Shell初尝Spark滋味 - 代码天地

Spark入门（一）--用Spark-Shell初尝Spark滋味

其他 2020-01-10 20:34:09 阅读次数: 0

Spark-Shell的使用

执行scala命令的spark-shell

进入spark的sbin目录，打开键入

./spark-shell

即可进入spark-shell的目录

spark-shell运行过程从上层来看，每一个spark应用都是由驱动器程序发起集群上的并行操作，在spark-shell中驱动器程序就是spark-shell本身。驱动器通过SparkContext对象来访问spark。事实上在shell启动时就创建了一个SparkContext的对象，其变量是sc，通过shell来查看sc如下

通过sc来读取文件：

hello文件中的内容为

u'you,jump
i,jump
you,jump
i,jump
u,jump

我们在命令行键入

val lines = sc.textFile("/spark/hello”)
lines.count()
lines.first()

这里注意到，由于我的sapark是在hadoop集群环境下的，所以这里完整的目录可以理解成hdfs:///spark/hello。

以上这条命令，就把spark目录下hello文件装载到sc当中，但事实上，由于spark的懒加载，此时的文件只有在被操作时才会真正被读取，即lines.count()和lines.first()被执行时，才回去读取内容

执行python命令的spark-shell

当然我们也可以用进入执行python命令的spark-shell。方法如下进入spark的sbin目录，打开键入

./pyspark-shell

通过python-shell统计hadoop文件目录下的 /spark/hello文件，如下

lines = sc.textFile('/spark/hello’)
lines.count()
lines.first()

结果如下：

到这里我们的spark-shell就算是正常执行，其中

读取/spark/hello文件：

lines = sc.textFile('/spark/hello’)

获取总行数：

lines.count()

第一行内容：

lines.first()

转自：https://juejin.im/post/5c73dee0518825628c30f1d0

猜你喜欢

转载自www.cnblogs.com/tjp40922/p/12177908.html

Spark入门（一）--用Spark-Shell初尝Spark滋味

spark-shell解析

spark-shell

spark-shell 参数

剖析Spark-Shell

Spark源码解析(一) —— Spark-shell浅析

【Spark内核源码】解析“spark-shell”（一）

spark-sql入门（一）通过spark-shell命令行操作

spark-shell启动spark报错

Spark2.1.0——剖析spark-shell

[Spark] spark-shell 命令使用

Spark 05 spark-shell 使用

spark(2.2) - spark-shell RDD编程

spark-shell启动错误

本地启动spark-shell

spark-shell 高级操作

执行spark-shell报错：

SparkContext和spark-shell

spark-shell启动报错

Spark从入门到精通二----spark任务的提交方式spark-shell/spark-submit----------各种版本的wordcount

spark-shell的Scala的一些方法详解

使用spark-shell操作Carbondata

Spark-shell初体验：WordCount

启动spark-shell --master yarn的bug

spark-shell到sparkcontext的过程

三、Spark-shell执行计算

CDH Spark-shell启动报错

spark-shell无法退格/删除

spark-shell开发wordcount程序

spark-shell读取parquet文件

今日推荐

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

周排行

Java基础复习_day13_Collection集合

2018.11.16 c语言学习经验

且看Java内置四大核心函数式接口

小程序云开发中数据库的数据分段和显示图片

python的函数

Web-JS进阶

【干货】C++常用代码积累笔记大全

Spring的ioc操作与 IOC底层原理

构建之法20191121-11 Scrum立会报告+燃尽图 07

Spring boot之Hello World访问404

每日归档

更多

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)