使用Spark Shell开发运行Spark程序 - 代码天地

使用Spark Shell开发运行Spark程序

其他 2019-01-15 18:29:02 阅读次数: 0

使用Spark Shell开发运行Spark程序

Spark Shell是一种学习API的简单途径，也是分析数据集交互的有力工具。
虽然本章还没涉及Spark的具体技术细节，但从总体上说，
Spark弹性数据集RDD有两种创建方式：
❑ 从文件系统输入（如HDFS）。
❑ 从已存在的RDD转换得到新的RDD。
现在我们从RDD入手，利用Spark Shell简单演示如何书写并运行Spark程序。
下面以word count这个经典例子来说明。
1）启动spark shell: cd进SPARK_HOME/bin，执行命令。

./spark-shell

2）进入scala命令行，执行如下命令：

scala> val file = sc.textFile("hdfs://localhost:50040/hellosparkshell")
scala> val count = file.flatMap(line => line.split(" ")).map(word => (word, 1)).
reduceByKey(_+_)
scala> count.collect()

首先从本机上读取文件hellosparkshell，然后解析该文件，最后统计单词及其数量并输出如下：

15/09/29  16:11:46  INFO  spark.SparkContext:  Job  finished:  collect  at<console>:17, took 1.624248037 s
res5: Array[(String, Int)] = Array((hello,12), (spark,12), (shell,12), (this,1),
(is,1), (chapter,1), (three,1)

猜你喜欢

转载自blog.csdn.net/qq_43688472/article/details/86412941

使用Spark Shell开发运行Spark程序

使用IDEA开发Spark程序

Spark Shell简单使用

使用Docker运行spark

[Spark] spark-shell 命令使用

Spark 05 spark-shell 使用

Spark编程入门之使用Spark Shell

Spark 使用

Learning Spark——使用Intellij Idea开发基于Maven的Spark程序

spark-shell开发wordcount程序

eclipse开发spark程序配置本地运行

Spark 04 Spark SQL 使用

Spark集群中使用spark。

实战详解使用IDE开发Spark程序

在spark-shell中运行代码编写Spark独立应用程序在集群上运行Spark应用程序

spark shell的运行模式汇总

spark shell的运行模式汇总

使用sbt构建spark 程序

使用IDEA开发Spark SQL

Hive、Beeline、Spark-SQL、Spark-Shell CLI使用

Spark-on-YARN运行Spark程序

Hadoop：开发机运行spark程序，抛出异常：ERROR Shell: Failed to locate the winutils binary in the hadoop binary path

Eclipse IDE 使用Java语言运行Spark程序

如何在本地使用scala或python运行Spark程序

Spark(29)-Spark Shell及编写Spark独立应用程序

spark学习使用记录

spark使用总结

spark udap 使用2

spark udaf的使用

Spark Streaming 的foreachRDD使用

今日推荐

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

周排行

[编程题]学英语

[codeforces 1288A] Deadline 约数+模

Python的web开发

Docker在Centos 7上的部署

python编码

解决Ubuntu16.04 fatal error: json/json.h: No such file or directory

mysql并发插入

rest接口如何适应jsonp的方案

linux 终端上网设置

高数——等号两边同时求导、积分的解释

每日归档

更多

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)