HashPatitioner
1.默认分区器
2.聚合算子如果没有分区器就是默认分区器对shuffle后的rdd进行重新分区
缺点:
容易造成数据倾斜
RangePartitioner
sortByKey排序算子使用的RangePartitioner
看源码
在0分区
在3分区
在4分区
HashPatitioner
1.默认分区器
2.聚合算子如果没有分区器就是默认分区器对shuffle后的rdd进行重新分区
缺点:
容易造成数据倾斜
RangePartitioner
sortByKey排序算子使用的RangePartitioner
看源码
在0分区
在3分区
在4分区