基于Spark下WordCount的Demo - 代码天地

基于Spark下WordCount的Demo

其他 2019-04-16 17:25:06 阅读次数: 0

版权声明：原创作品转载必须标明出处，谢谢配合！ https://blog.csdn.net/qq_38704184/article/details/86315649

import org.apache.spark.{SparkConf, SparkContext}
object WordCount {
  def main(args: Array[String]): Unit = {
    /**
      * 创建SparkConf（）并设置App名称
      * local指本地
      * 2代表在本地起两个线程
      */
    val conf = new SparkConf().setAppName("WC").setMaster("local[2]")

    /**
      * 创建SparkContext,该对象是提交的Spark App的入口
      */
    val sc = new SparkContext(conf)

    /**
      * 使用sc创建RDD并执行相应的transformation和action
      * 1:按照空格进行切分
      * 2：将得到的数组中的元素组合成（单词，1）的形式
      * 3：统计相同的key出现多少次
      * 4：根据出现的次数将元组进行排序，默认是升序，false代表降序
      * 5：保存到相应的本地目录下
      */
    sc.textFile("E:\\words.txt").
      flatMap(_.split(" ")).
      map((_,1)).
      reduceByKey(_+_,1).
      sortBy(_._2,false).
      saveAsTextFile("E:\\outputFile")
    //关闭资源
    sc.stop()

  }
}

猜你喜欢

转载自blog.csdn.net/qq_38704184/article/details/86315649

基于Spark下WordCount的Demo

Spark- WordCount Demo

基于spark开发wordcount案例

Spark-用IDEA编写wordcount demo

基于Spark下的查询数据库中信息Demo

基于Spark下的自定义分区Demo

基于Spark下查询ip详细信息Demo

基于Java的Spark WordCount编程实现

Spark WordCount

Spark的WordCount

Spark学习笔记：基于HDFS的实时计算WordCount

Kubernetes编译并运行基于Scalar的Spark程序WordCount（二）

IDEA下使用Maven搭建spark开发环境WordCount示例

Hadoop——跑wordcount demo

spark eclipse写wordcount

Spark入门之WordCount

Spark wordCount案例

spark 例子wordcount topk

Spark的WordCount练习（二）

spark---01---wordcount

Spark wordcount入门

spark的wordcount执行流程

Spark job WordCount分析

spark入门程序WordCount

Spark核心编程-WordCount

使用 Spark 创建WordCount

Spark写WordCount

WordCount在Spark的执行原理

spark_wordcount

spark streaming中WordCount

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

基本数据类型封装类比较 Java源码解读(一) 8种基本类型对应的封装类型

JS实现无缝滚动上

深入解析HashMap原理（基于JDK1.8）

mysql的连接池

关于.htc

linux下的ubuntu12.04图形界面

【数论】好推不好记的扩展欧几里德

设备树详解

cscope + tags 简单设置

xml学习

每日归档

更多

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)