Spark 实现气温统计


0. 说明

  聚合气温数据,聚合出 MAX 、 MIN 、 AVG


1. Spark Shell 实现

  1.1 MAX

  分步实现

# 加载文档
val rdd1 = sc.textFile("file:///home/centos/temp3.dat")

# 压扁
val rdd2 = rdd1.map(line=>{var arr = line.split(" ");(arr(0).toInt , arr(1).toInt)})

# 得到最大值
val rdd3 = rdd2.reduceByKey((a,b)=>if(a > b)a else b)

rdd3.collect

# 升序
val rdd4 = rdd3.sortByKey(true)

rdd4.collect

# 遍历输出
rdd4.foreach(println)

  一步完成

猜你喜欢

转载自www.cnblogs.com/share23/p/9757095.html
今日推荐