版权声明:版权声明:本文为博主原创文章,转载请附上博文链接! https://blog.csdn.net/qq_42246689/article/details/84671998
1、 好的模型设计
2 、解决数据倾斜
3 、减少job数
4 、设置合理的map reduce的task数
5 、对小文件进行合并
6 、单个作业最优不如整体最优
1、 好的模型设计
2 、解决数据倾斜
3 、减少job数
4 、设置合理的map reduce的task数
5 、对小文件进行合并
6 、单个作业最优不如整体最优