【大数据】Spark数据分区

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/cheidou123/article/details/86437019

一 前言

Spark可以通过控制RDD分区方式来减少通讯开销。所有键值对RDD都可以进行分区,Spark可以确保同一组的键出现在同一个节点上。

自定义分区

猜你喜欢

转载自blog.csdn.net/cheidou123/article/details/86437019