MapReduce : shuffle机制 -- 排序和分发 - 代码天地

MapReduce : shuffle机制 -- 排序和分发

其他 2019-01-22 17:45:04 阅读次数: 0

maptask数量由inputsplit切片规划是由InputFormat的具体实现子类来实现，就是调用
InputSplits[ ] getSplits() 方法，这个方法的逻辑可以自定义
在默认情况下，由FileInputFormat来实现

1多个maptask程序分别读取一部分文件内容
2每次读取一行,执行map逻辑,发给缓冲区,缓冲区大小默认100M,
3有线程监控缓冲区,当超过80%时,做溢出处理,将缓冲区内容持久化到hadoop文件
4溢出文件是分区的,根据reducetask个数决定,
5溢出文件内部是有序的,
6处理大数据时会有多个溢出文件
7将多个溢出文件的每个分区合并(归并排序)后分发给对应的reducetask
8reducetask获取到每个maptask分发的文件后再次合并(归并排序)
9再执行reduce业务逻辑

参考:
MR执行流程详解
https://blog.csdn.net/milkcoffeezhu/article/details/80551586

Yarn的工作流程（mr提交应用程序
https://blog.csdn.net/qq_34382453/article/details/83069781

YARN的工作机制
https://blog.csdn.net/kaede1209/article/details/81148606

猜你喜欢

转载自blog.csdn.net/weixin_39979119/article/details/85007706

MapReduce : shuffle机制 -- 排序和分发

MapReduce 的 Shuffle 机制

MapReduce的Shuffle机制

浅谈MapReduce的shuffle机制

MapReduce之Shuffle机制

MapReduce之Shuffle机制-自定义排序-06

MapReduce中的shuffle和排序

MapReduce补充-排序-分组-切片和shuffle机制Split切片机制

mapreduce和shuffle详解

MapReduce 原理之Shuffle机制

MapReduce的整体流程、及shuffle机制

MapReduce框架中的Shuffle机制

MapReduce快速入门系列(5) | MapReduce任务流程和shuffle机制的简单解析

MapReduce中shuffle和排序(转)

MapReduce的shuffle和Spark的shuffle的之间的关系

MapReduce之Shuffle机制-GroupingComparator分组-08

MapReduce之Shuffle机制-Combiner合并-07

MapReduce框架原理之Shuffle机制

Hadoop之 MapReduce （Shuffle机制详解）

MapReduce执行流程之shuffle机制

MapReduce（5）--MapReduce shuffle阶段数据的压缩机制

MapReduce Shuffle

MapReduce的shuffle

shuffle机制和原理

学习笔记：MapReduce shuffle和排序（理论层级）

MapReduce的shuffle原理---shuffle为什么要排序？

Hadoop : MapReduce中的Shuffle和Sort分析

MapReduce中的Shuffle和Sort分析

MapReduce和spark的shuffle过程详解

MapReduce执行流程和Shuffle过程

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

循环神经网络（rnn）讲解

Tigao教程四：单独的关节运动

金蝶K3WISE15.0-注册套打教程

如何在Mac上配置Kubernetes

Android应用结束自身进程的方法

SpringMVC学习十三拦截器栈

中国驻洛杉矶总领馆举行新春招待会

HttpClient get post 发送

11 - three.js 笔记 - 绘制三维字体模型

Mysql递归获取某个父节点下面的所有子节点和子节点上的所有父节点

每日归档

更多

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)