spark 版 WordCount 程序分析 - 代码天地

spark 版 WordCount 程序分析

其他 2019-02-23 16:30:48 阅读次数: 0

目录

1、开发环境 idea+maven+spark
2、程序代码
3、集群提交

1、开发环境 idea+maven+spark

使用idea，创建maven工程，使用scala 编写程序，打包jar并运行在集群中

2、程序代码

package cn.learn.spark

import org.apache.spark.{SparkConf, SparkContext}

object WordCount {
  def main(args: Array[String]) {
    val conf = new SparkConf().setAppName("WC")
    val sc = new SparkContext(conf)
    sc.textFile(args(0)).flatMap(_.split(" ")).map((_,1)).reduceByKey(_+_).sortBy(_._2,false ).saveAsTextFile(args(1))
    sc.stop()
  }
}

3、集群提交

进入spark的bin目录，提交代码如下：

./spark-submit \

--master spark://hbase1:7077 \ -------> spark集群的主节点

--class cn.learn.spark.WordCount \ -------> wordCount 程序入口main方法

--total-executor-cores 2 \ -------> 指定执行器总核数

--executor-memory 512m \ -------> 指定每个核占用内存

/home/hadoop/helloSpark-1.0.jar \ -------> 指定程序jar的位置

hdfs://hbase1:9000/wc \ -------> 指定程序参数一：输入集合

hdfs://hbase1:9000/out2 -------> 指定程序参数二：输出集合

猜你喜欢

转载自blog.csdn.net/py_tamir/article/details/86567123

spark 版 WordCount 程序分析

Spark job WordCount分析

spark入门程序WordCount

Spark开发wordcount程序

Spark -- WordCount程序

Spark 编写WordCount程序

spark wordcount程序

从wordcount分析spark提交job

Spark的Wordcount程序图文详解！

Spark WordCount

Spark的WordCount

scala版 wordcount 程序整体分析及分步分析

spark程序入门-wordCount详解总结

在Spark Shell中编写WordCount程序

spark-shell开发wordcount程序

spark：开发本地测试的wordcount程序

spark wordcount 第一个spark 程序

Spark系列(五)IDEA编写及调试Spark的WordCount程序

【Spark】Spark On Yarn 环境搭建及 WordCount 程序原理深度剖析

hadoop入门程序，wordcount本地版实现

Ubuntu 16.04 SPARK 开发环境搭建-- 伪分布版与新建一个Spark版本的WordCount

Spark里WordCount程序三种写法

java使用spark2开发本地测试的wordCount程序

第一个spark程序----WordCount

4、wordcount程序原理剖析及Spark架构原理

Kubernetes编译并运行基于Scalar的Spark程序WordCount（二）

Spark运行第一个Scala程序WordCount

Linux安装Spark+pyspark，运行wordCount程序

03-第一个Spark程序WordCount

spark eclipse写wordcount

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)