Spark入门之WordCount - 代码天地

Spark入门之WordCount

编程语言 2018-05-14 02:56:15 阅读次数: 2

环境:
Hadoop版本：Apache Hadoop2.7.1
Spark版本：Apache Spark1.4.1
核心代码：

测试数据：

a,b,a
c,d,f
a,b,h,p,z
a,f,o

在命令行使用sbt打包：sbt clean package
上传jar至Hadoop或者Spark的集群上，如何提交？

三种模式提交:
（1）需要启动HDFS+YRAN，无须启动spark的standalone集群
bin/spark-submit  --class com.spark.helloword.WordCount   --master yarn-client  ./spark-hello_2.11-1.0.jar

（2）启动spark的standalone集群，并启动的Hadoop的HDFS分布式存储系统即可
bin/spark-submit  --class  com.spark.helloword.WordCount  --master spark://h1:7077 ./spark-hello_2.11-1.0.jar 

（3）//需要启动HDFS+YRAN，无须启动spark的standalone集群
//--name 指定作业名字
bin/spark-submit  --class com.spark.helloword.WordCount   --master yarn-cluster  --name test-spark-wordcount   ./spark-hello_2.11-1.0.jar

执行结果：

(a,4)
(b,2)
(f,2)
(d,1)
(z,1)
(p,1)
(h,1)
(o,1)
(c,1)

运行模式截图：

最后欢迎大家扫码关注微信公众号：我是攻城师(woshigcs)，我们一起学习，进步和交流!（woshigcs）
本公众号的内容是有关搜索和大数据技术和互联网等方面内容的分享，也是一个温馨的技术互动交流的小家园，有什么问题随时都可以留言，欢迎大家来访！

猜你喜欢

转载自qindongliang.iteye.com/blog/2241149

Spark入门之WordCount

Spark wordcount入门

spark入门程序WordCount

从WordCount入门Spark Streaming

spark简单入门案例wordCount

Hive入门之WordCount

Spark Streaming流式计算的WordCount入门

spark程序入门-wordCount详解总结

flink的入门案例之wordcount

mapreduce入门程序之---wordcount

Spark入门三部曲之第三步Spark程序的开发和运行及WordCount

Spark使用UDF函数之WordCount实现

IntelliJ IDEA开发Spark案例之WordCount

Spark WordCount

Spark的WordCount

spark入门二（算子介绍核wordcount入门）

Spark Streaming整合Spark SQL之wordcount案例

Spark深入解析（六）：SparkCore之Spark代码编写WordCount

spark的学习（1）之使用spark进行WordCount词数统计

spark 基础概率与编程wordcount入门1 javaAPI版本

Spark Streaming快速入门系列(2) | wordcount案例

大数MapReduce入门之wordcount算法

Storm-Storm入门之WordCount程序

kafka&&sparkstreaming整合入门之Wordcount

十五、Hadoop MapReduce之WordCount极速入门

Spark从入门到精通三------scala版本的wordcount---java版本的wordcount----java-lambda版本的wordcount

spark学习03之wordCount统计并排序(java)

Spark Streaming 自定义数据源之 WordCount

Spark深入解析（七）：SparkCore之IDEA编写WordCount

Spark从入门到精通二----spark任务的提交方式spark-shell/spark-submit----------各种版本的wordcount

今日推荐

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

周排行

rbac——界面、权限

Apache CXF + SpringMVC 整合发布WebService

so插件化

Vue.js实战系列---图标字体制作（svg格式）

PAT乙级 1007 素数对猜想(孪生素数对) (20分) ---（C语言 + 详细注释）

被IRM保护的文档，打开失败

Calendar和Date计算日期差的小问题

win10子系统ubuntu18.4安装docker

利用Wrap Shell Script定位Android Native内存泄漏

MySQL: Transaction (Part I - Basic Concept)

每日归档

更多

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)