Hive_HIVE优化指南_场景六_通过让MAP 端, 多去承担任务, 去减少 Reducer 的计算成本 和 数据传输成本

大纲地址 : https://blog.csdn.net/u010003835/article/details/105334641

测试数据 

 

场景六.通过让MAP 端, 多去承担任务, 去减少 Reducer 的计算成本 和 数据传输成本。

1)MAP JOIN 的方式

 

 

 

2)  MAP AGGR , 在 Map 端进行预聚合

发布了519 篇原创文章 · 获赞 1146 · 访问量 283万+

猜你喜欢

转载自blog.csdn.net/u010003835/article/details/105495067