scala语言实现wordcount - 代码天地

scala语言实现wordcount

其他 2021-03-31 18:42:18 阅读次数: 0

object wordCount{
    
    
  def main(args: Array[String]): Unit = {
    
    
    val str = List("hadoop hive hadoop","hive hello mysql pig hello hadoop")
    val res1 = str.flatMap((s:String)=>s.split(" "))//1.按空格来切分单词
    //res1= List(hadoop, hive, hadoop, hive, hello, mysql, pig, hello, hadoop)

    val res2 = res1.map((x:String)=>((x:String),1)) //2.将每个切分后的元素创建成对偶元祖的形式(K,V)
    //res2= List((hadoop,1), (hive,1), (hadoop,1), (hive,1), (hello,1), (mysql,1), (pig,1), (hello,1), (hadoop,1))

    val res3 = res2.groupBy((x:(String,Int))=>(x._1))//3.将对偶元祖中的元素按不同的单词依次分组,  _.1表示元组的第1个值
    //res3= Map(hadoop -> List((hadoop,1), (hadoop,1), (hadoop,1)), hive -> List((hive,1), (hive,1)), mysql -> List((mysql,1)), hello -> List((hello,1), (hello,1)), pig -> List((pig,1)))

    val res4 = res3.toList.map((x:(String,List[(String,Int)]))=>(x._1,x._2.size)) //4.求出每个单词出现的次数,因为Map没有提供计算长度的方法，所以先转换为List，然后计算单词出现的次数
    //res4= List((hadoop,3), (hive,2), (mysql,1), (hello,2), (pig,1))

    /*  对上述代码的简化版
val res2 = res1.map((_,1))
val res3 = res2.groupBy(_._1)
val res4 = res3.toList.map((x)=>(x._1,x._2.size))
val res5 =str.flatMap(_.split(" ")).map((_,1)).groupBy(_._1).toList.map((x)=>(x._1,x._2.size))
     */

    /*  wordcount程序的简化最终版
    val res5 =str.flatMap(_.split(" ")).map((_,1)).groupBy(_._1).toList.map((x)=>(x._1,x._2.size))
    println("res5= "+res5)
     */
    for(item <- res4){
    
    
      println(item)
    }

  }
}

运行结果：

在这里插入图片描述

这里对上述scala中参数类型推断和化简写法进行一个简单的说明
1.参数类型是可以推断时，可以省略参数类型
2.当传入的函数，只有单个参数时，可以省去括号
3.如果变量只在=>右边只出现一次，可以用_来代替

对上述代码中高阶函数有不明确的可以参考一下这位博主的文章
https://blog.csdn.net/m0_38109926/article/details/108695731

猜你喜欢

转载自blog.csdn.net/weixin_44080445/article/details/109501445

scala语言实现wordcount

WordCount：C语言实现

scala语言实现排序

用Scala语言实现冒泡排序

scala 实现wordcount

Scala实现wordcount

Scala 实现 WordCount

软件工程-wordcount（C语言实现）

结对编程项目——C语言实现WordCount Web化

Scala实现WordCount简易案例

scala语言实现各种加密算法

WordCount C语言实现求文本的字符数，单词数，行数

Scala集合实现WordCount代码实现

使用Scala实现Spark wordcount统计

Spark：用Scala和Java实现WordCount

scala快速入门系列【Actor实现WordCount】

Scala集合实现WordCount单词统计代码

scala wordcount

wordCount scala

Scala WordCount / Java WordCount

Spark 大数据中文分词统计（三） Scala语言实现分词统计

在IDEA中使用Scala语言编写WordCount程序

scala实现wordcount方法-商品标签统计-气温统计

快学Scala-Actor并发编程实现WordCount

使用Scala程序实现WordCount--词频统计（代码）

Scala的安装配置以及简单WordCount词频分析的实现

Spark 用Scala和Java分别实现wordcount

震惊！scala一行代码实现wordcount！！！

Spark 编程案例 WordCount、TopKey【Scala代码实现】

Spark—通过Java、Scala API实现WordCount案例的基本操作

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)