Spark-RDD编程之常见执行操作

执行操作(action)是向应用程序返回值或向存储系统导出数据的操作,常见的有first,count,collect,take等。

scala>val rdd=sc.makeRDD(1 to 10)

#返回RDD中的第一个元素

scala>rdd.first

#统计RDD中元素的个数

scala>rdd.count

#对RDD中元素累加求和

scala>rdd.reduce(_+_)

#对RDD中所有元素求积

scala>rdd.reduce(_*_)

#打印出RDD中所有元素

scala>rdd.collect

#返回集合中的前三个元素

scala>rdd.take(3)

#排序后返回前三个元素

scala>rdd.top(3)

猜你喜欢

转载自blog.csdn.net/mmake1994/article/details/79785876