MapReduce的整体流程、及shuffle机制 - 代码天地

MapReduce的整体流程、及shuffle机制

编程语言 2018-12-08 14:45:32 阅读次数: 0

MapReduce的整体流程
   1、待处理数据
   2、提交客户端submit()
   3、提交信息切片----hadoop jar wc.jar
   4、计算出maptask数量----（nodemanger开辟maptask)
   5、使用TextInputFormat读待处理数据----RecordReader
   6、context.write()源码中用InputOutputContext向环形缓冲区写数据----默认分区和排序   默认为100M，超过80%发生溢写
   7、归并排序
   8、下载到reduceTask本地磁盘
   9、合并文件，归并排序
   10、一次读取一组
   11、默认TextOutputFormat----RecordWrite

shuffle机制（map之后，reduce之前）
   1、写入数据到唤醒缓冲区，默认100M，超过80%，发生溢写
   2、第一次溢写，
   3、进行分区
   4、进行排序
   5、合并，----Combiner可选操作，合并是区与里面发生排序就会触发
   6、归并----合并是每个区内的合并，归并是区与区之间的合并
   7、输出，context()写磁盘
   8、拷贝
   9、内存不够益处到磁盘
   10、归并排序
   11、按照相同的key分组

猜你喜欢

转载自blog.csdn.net/weixin_42898914/article/details/84891358

MapReduce的整体流程、及shuffle机制

MapReduce执行流程之shuffle机制

MapReduce 的 Shuffle 机制

MapReduce的Shuffle机制

浅谈MapReduce的shuffle机制

MapReduce之Shuffle机制

MapReduce之Map,Reduce,Shuffle,Yarn的机制+流程图

MapReduce执行流程Shuffle

MapReduce的shuffle流程

MapReduce整体流程简述

大数据-Hadoop生态(17)-MapReduce框架原理-MapReduce流程,Shuffle机制,Partition分区

MapReduce快速入门系列(5) | MapReduce任务流程和shuffle机制的简单解析

MapReduce 原理之Shuffle机制

MapReduce框架中的Shuffle机制

[2] - mapreduce的shuffle流程详解

MapReduce运行机制全流程 -------- 包括shuffle机制详解（附图）

MapReduce : shuffle机制 -- 排序和分发

MapReduce之Shuffle机制-GroupingComparator分组-08

MapReduce之Shuffle机制-Combiner合并-07

MapReduce框架原理之Shuffle机制

Hadoop之 MapReduce （Shuffle机制详解）

MapReduce 之 Shuffle 的详细流程

MapReduce架构，shuffle，mapred，hdfs读流程

2.25 MapReduce执行流程Shuffle讲解一

Hadoop中mapreduce中的shuffle执行流程

MapReduce执行流程和Shuffle过程

大数据技术之_05_Hadoop学习_02_MapReduce_MapReduce框架原理+InputFormat数据输入+MapReduce工作流程(面试重点)+Shuffle机制(面试重点)

MapReduce（5）--MapReduce shuffle阶段数据的压缩机制

MapReduce Shuffle

MapReduce的shuffle

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

循环神经网络（rnn）讲解

Tigao教程四：单独的关节运动

金蝶K3WISE15.0-注册套打教程

如何在Mac上配置Kubernetes

Android应用结束自身进程的方法

SpringMVC学习十三拦截器栈

中国驻洛杉矶总领馆举行新春招待会

HttpClient get post 发送

11 - three.js 笔记 - 绘制三维字体模型

Mysql递归获取某个父节点下面的所有子节点和子节点上的所有父节点

每日归档

更多

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)