MapReduce 原理之工作流程 - 代码天地

MapReduce 原理之工作流程

其他 2018-07-11 14:49:24 阅读次数: 0

1.流程示意图

2.流程详解

上面的流程是整个mapreduce最全工作流程，但是shuffle过程只是从第7步开始到第16步结束，具体shuffle过程详解，如下：

1）maptask收集我们的map()方法输出的kv对，放到内存缓冲区中

2）从内存缓冲区不断溢出本地磁盘文件，可能会溢出多个文件

3）多个溢出文件会被合并成大的溢出文件

4）在溢出过程中，及合并的过程中，都要调用partitioner进行分区和针对key进行排序

5）reducetask根据自己的分区号，去各个maptask机器上取相应的结果分区数据

6）reducetask会取到同一个分区的来自不同maptask的结果文件，reducetask会将这些文件再进行合并（归并排序）

7）合并成大文件后，shuffle的过程也就结束了，后面进入reducetask的逻辑运算过程（从文件中取出一个一个的键值对group，调用用户自定义的reduce()方法）

3.注意

Shuffle中的缓冲区大小会影响到mapreduce程序的执行效率，原则上说，缓冲区越大，磁盘io的次数越少，执行速度就越快。

缓冲区的大小可以通过参数调整，参数：io.sort.mb 默认100M。

猜你喜欢

转载自blog.csdn.net/luomingkui1109/article/details/80949285

MapReduce 原理之工作流程

MapReduce框架原理之（二）MapReduce工作流程

MapReduce框架原理之MapReduce工作流程

Yarn工作原理及MapReduce工作流程

MapReduce工作流程和工作原理

MapReduce工作流程和原理

MapReduce工作流程

Hadoop 之 MapReduce （InputFormat 和 MapReduce工作流程）

mapreduce on yarn的工作流程

Mapreduce工作流程总结

MapReduce工作流程分析

Mapreduce基本工作流程

MapReduce简述、工作流程

【Hadoop学习之MapReduce】_19MR工作流程

大数据技术之_05_Hadoop学习_02_MapReduce_MapReduce框架原理+InputFormat数据输入+MapReduce工作流程(面试重点)+Shuffle机制(面试重点)

十二、MapReduce详细工作流程

mapreduce job在yarn上的工作流程

MapReduce工作流程超详细解释

4 MapReduce 工作流程详解

MapReduce的详细工作流程

Yarn及MapReduce工作流程（总结版）

干货丨MapReduce的工作流程是怎样的？

图文详解 MapReduce 工作流程

大数据技术之Hadoop之MapReduce（3）——MapReduce工作流程

MapReduce的工作流

三-中下, 大数据基础架构Hadoop- MapReduce框架原理和工作流程剖析

Hadoop之MapReduce工作原理

MapReduce2提交到yarn上工作流程

MapReduce job提交到Yarn的工作流程

大数据笔记 3--MapReduce工作流程

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

周排行

Metasploit文件目录与入侵基本概念

跨域(CORS)请求问题[No 'Access-Control-Allow-Origin' header is present on the requested resource]常见解决方案

CodeIgniter 源码解读之 CodeIgniter.php（二）

SAS入门之（四）改变数据类型

初识元组

[数学建模]数学建模算法和模型（B站视频）（二）

Nginx 服务器源码安装配置流程

C#实现语音视频录制【基于MCapture + MFile】

开发进度4

下载安装vue的方法网址

每日归档

更多

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)