Spark shell交互 - 代码天地

Spark shell交互

其他 2019-03-24 14:21:04 阅读次数: 0

Spark带有交互式的Shell 可以作为即时数据分析接口，相对于Python Bash Windows Shell等，Spark Shell最大的特点是可以用来与分布式存储在许多机器的内存或磁盘上数据进行交互，并且处理过程的分发由Spark自动完成

Spark能够在工作节点上把数据读取到内存，所以分布式计算都可以在几秒内完成，即使探索性分析变得很适合Spark，Spark提供Python以及Scala增强版的Shell 支持与集群的连接

启动Spark-shell

对于语句 val line=sc.textFile("test.txt") 从本地文件读取一个RDD

lines.count() lines.first()则是RDD数据集的操作

每一个Spark应用都由一个驱动器程序 Driver Program来发起集群上的各种并行操作，驱动器程序包含Main过程，并且定义了集群上的分布式数据集，如上面例子的Spark-Shell就是一个驱动器程序

驱动器程序通过一个SparkContext对象来访问Spark 这个对象代表对计算集群的一个连接，Spark-shell启动时自动初始化一个SparkConetxt对象，即sc变量

要执行操作，驱动器程序一般管理多个执行器节点，使他们并行的完成计算任务

猜你喜欢

转载自blog.csdn.net/qq_33369979/article/details/88775673

Spark shell交互

Spark shell

Spark（6）——Spark与scala交互

spark学习——spark shell学习

spark与kafka的交互

在Spark shell中基于HDFS文件系统进行wordcount交互式分析

spark shell的学习

Spark Shell简单使用

spark-shell解析

spark-shell

spark-shell 参数

spark shell hive sql

剖析Spark-Shell

spark shell操作

Spark的shell界面操作

Spark Shell笔记

Spark(2)SBT and Spark Shell in Quick Start

spark-shell启动spark报错

Spark2.1.0——剖析spark-shell

[Spark] spark-shell 命令使用

Spark 05 spark-shell 使用

Spark源码分析之Spark Shell（上）

Spark基础 -- Spark Shell -- RDD -- 算子

spark(2.2) - spark-shell RDD编程

Spark源码分析之Spark Shell（下）

Spark Shell和spark集群的节点

Spark009--spark-shell执行流程

spark通过spark shell执行WordCount

Spark编程入门之使用Spark Shell

Spark SQL 和 Hive 的交互

今日推荐

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

周排行

Java基础复习_day13_Collection集合

2018.11.16 c语言学习经验

且看Java内置四大核心函数式接口

小程序云开发中数据库的数据分段和显示图片

python的函数

Web-JS进阶

【干货】C++常用代码积累笔记大全

Spring的ioc操作与 IOC底层原理

构建之法20191121-11 Scrum立会报告+燃尽图 07

Spring boot之Hello World访问404

每日归档

更多

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)