第一个spark程序----WordCount - 代码天地

第一个spark程序----WordCount

编程语言 2019-01-17 02:36:33 阅读次数: 0

和hadoop一样，学习spark从WordCount开始。

启动Spark Shell
spark-shell是Spark自带的交互式Shell程序，方便用户进行交互式编程，用户可以在该命令行下用scala编写spark程序。
执行命令 bin/spark-shell
启动hdfs
上传一个文档到hdfs
编写WordCount
在Spark shell中用scala语言编写spark程序

sc.textFile("hdfs://hadoop02:9000/RELEASE").flatMap(_.split(" ")).map((_,1)).reduceByKey(_+_).saveAsTextFile("hdfs://hadoop02:9000/out1")

提交后，在hdfs中查看结果
在这里插入图片描述

这就是执行后的WordCount结果。

代码解析：

sc 是SparkContext对象，该对象时提交spark程序的入口
textFile(hdfs://hadoop102:9000/RELEASE) 是hdfs中读取数据
flatMap(_.split(" "))先map在压平
map((_,1)) 将单词和1构成元组
reduceByKey(_+_) 按照key进行reduce，并将value累加
saveAsTextFile("hdfs:// hadoop102:9000/out1") 将结果写入到hdfs中

猜你喜欢

转载自blog.csdn.net/chen7588693/article/details/86508310

spark wordcount 第一个spark 程序

第一个spark程序----WordCount

Spark运行第一个Scala程序WordCount

03-第一个Spark程序WordCount

Spark入门：第一个Spark应用程序：WordCount

【DataWhale-Spark】2.2-第一个Spark应用程序：WordCount

spark 第一个简单实例wordcount

IntelliJ IDEA 2021.1.2配置spark，并编写第一个scala程序WordCount

第一个Spark程序

Spark第一个程序

Spark第一个程序

大数据篇：Spark入门第一个Spark应用程序详解：WordCount

第一个hadoop程序-WordCount

Hadoop第一个程序wordcount

第一个MapReduce程序——WordCount

hadoop的第一个hello world程序（wordcount）

【本地模式】第一个Mapreduce程序-wordcount

SparkStreaming简介 - 与第一个Spark实时计算程序，使用netcat来写数据 - wordcount

第一个WordCount

spark基础---->spark的第一个程序

Intellij IDEA创建spark项目运行第一个WordCount详细图教程

关于Spark入门的第一个wordcount代码详解

从Intellij IDEA开始第一个Spark程序

Spark开发第一个程序

开发第一个Spark程序

执行第一个Spark程序

IDEA 中开发第一个Spark 程序

2.3 基于IDEA开发第一个MapReduce大数据程序WordCount

IDEA+Maven开发第一个Hadoop程序WordCount

学习Hadoop第一个MapReduce程序WordCount的详解

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)