Spark Core快速入门系列(8) | HashPartitioner和RangePartitioner

HashPatitioner

   1.默认分区器
   2.聚合算子如果没有分区器就是默认分区器对shuffle后的rdd进行重新分区
   缺点:
   容易造成数据倾斜

RangePartitioner
sortByKey排序算子使用的RangePartitioner
在这里插入图片描述
看源码
在0分区
在这里插入图片描述
在3分区
在这里插入图片描述
在4分区
在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/qq_46548855/article/details/108132126