前言
MapReduce是我们再进行离线大数据处理的时候经常要使用的计算模型,MapReduce的计算过程被封装的很好,我们只用使用Map和Reduce函数,所以对其整体的计算过程不是太清楚,同时MapReduce1.0和MapReduce2.0在网上有很多人混淆。
MapReduce1.0运行模型
input ->splitting->Mapping->Shuffing->Reducing->final result
第1步input
第2步splitting
第3步Mappin
第4步Shuffing
第5步Reducing