spark分组取topN - 代码天地

spark分组取topN

其他 2018-11-29 03:04:47 阅读次数: 0

准备数据：
aa 11
bb 11
cc 34
aa 22
bb 67
cc 29
aa 36
bb 33
cc 30
aa 42
bb 44
cc 49

import org.apache.spark.{SparkConf, SparkContext}

/**
  * @author zoujc
  * @date 2018/11/15
  */
object topN {
	def main(args: Array[String]): Unit = {
		val conf = new SparkConf().setAppName("topN").setMaster("local[2]")
		val sc = new SparkContext(conf)
		val topNRDD = sc.textFile("C:\\Users\\ZJC\\Desktop\\wc.txt")
        		.map(_.split(" "))
				.map(x => (x(0),x(1)))
				.groupByKey()
        		.map(x =>{
			        val xx = x._1
			        val yy = x._2
			        (xx,yy.toList.sorted.reverse.take(3))
		        })
		topNRDD.foreach(println)
	}
}

在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/weixin_38799368/article/details/84108078

spark分组取topN

spark 分组取topn

Spark core分组取topN案例

Spark-Java分组取TopN的优化

【Spark 应用】实现分组取topN

Spark：求出分组内的TopN

Spark-分组TOPN算法

Spark-分组TOPN算法：

spark学习记录（七、二次排序和分组取TopN问题）

SparkCore编程（一）-分组取topN

二次排序与分组取TopN

spark多字段排序与取topN

spark学习三——spark案例分析分组TopN

分组topN

Spark RDD 分组求TopN三种实现

Spark分组TopN（SQL风格SDL风格）另附：RDD操作

mysql分组取topN的三种方式

Spark: topN

hive 分组topN

mongodb 分组 topN

分组求topn

SQL 分组计算 topN

SQL再谈分组topN

spark 开窗函数 topN

Spark TopN 算法的实现

MongoDB系列之分组topN

MapReduce实现分组求TopN

mongodb 怎么算分组 topN

MapReduce 实现分片取TopN 再Reduce取TopN

Spark 实现TopN的问题（groupBy）

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

循环神经网络（rnn）讲解

Tigao教程四：单独的关节运动

金蝶K3WISE15.0-注册套打教程

如何在Mac上配置Kubernetes

Android应用结束自身进程的方法

SpringMVC学习十三拦截器栈

中国驻洛杉矶总领馆举行新春招待会

HttpClient get post 发送

11 - three.js 笔记 - 绘制三维字体模型

Mysql递归获取某个父节点下面的所有子节点和子节点上的所有父节点

每日归档

更多

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)