spark中的各种算子分类

1、Trasformtion算子
union、reduceByKey、groupBy、join、map、mapPartition
、cogroup、parallelize、textFile、leftoutJoin、flatMap、coalesce、Repartition

2、Action算子
count、take、collect、foreach、foreachPartition、saveAsTextFile、ditinct、
first、reduce

3、shuffle算子
reduceByKey、groupBy、join、coalesce、Repartition、leftoutJoin、cogroup

4、产生Stage划分的算子
reduceByKey、groupBy、join、coalesce、Repartition、leftoutJoin、cogroup

5、触发Job算子

count、take、collect、foreach、foreachPartition、saveAsTextFile、ditinct、
first、reduce

猜你喜欢

转载自blog.csdn.net/weixin_38842096/article/details/84311242