MapReduce程序运行流程分析总结 - 代码天地

MapReduce程序运行流程分析总结

其他 2019-01-29 22:00:52 阅读次数: 0

1）在MapReduce程序读取文件的输入目录上存放相应的文件。

2）客户端程序在submit()方法执行前，获取待处理的数据信息，然后根据集群中参数的配置形成一个任务分配规划。

3）客户端提交job.split、jar包、job.xml等文件给yarn，yarn中的resourcemanager启动MRAppMaster。

4）MRAppMaster启动后根据本次job的描述信息，计算出需要的maptask实例数量，然后向集群申请机器启动相应数量的maptask进程。

5）maptask利用客户指定的inputformat来读取数据，形成输入KV对。

6）maptask将输入KV对传递给客户定义的map()方法，做逻辑运算

7）map()运算完毕后将KV对收集到maptask缓存。

8）maptask缓存中的KV对按照K分区排序后不断写到磁盘文件

9）MRAppMaster监控到所有maptask进程任务完成之后，会根据客户指定的参数启动相应数量的reducetask进程，并告知reducetask进程要处理的数据分区。

10）Reducetask进程启动之后，根据MRAppMaster告知的待处理数据所在位置，从若干台maptask运行所在机器上获取到若干个maptask输出结果文件，并在本地进行重新归并排序，然后按照相同key的KV为一个组，调用客户定义的reduce()方法进行逻辑运算。

11）Reducetask运算完毕后，调用客户指定的outputformat将结果数据输出到外部存储。

猜你喜欢

转载自blog.csdn.net/qq_40310148/article/details/86634131

MapReduce程序运行流程分析总结

MapReduce程序运行流程分析

MapReduce运行流程分析

MapReduce程序运行流程

MapReduce程序在yarn集群上流程分析

MapReduce的运行流程

Hadoop Mapreduce运行流程

Mapreduce的Job运行流程

MapReduce运行流程

MapReduce作业运行流程

17mapreduce运行全流程——好程序

MapReduce流程分析

MapReduce程序运行拆解

MapReduce 程序运行方式

MapReduce程序运行模式

Java程序的运行过程（执行流程）分析

MapReduce源码分析总结

mapreduce 提交job 流程分析

MapReduce工作流程分析

Mapreduce工作流程总结

hdfs,mapreduce相关流程总结

YARN上运行MapReduce程序

运行mapreduce 程序报错 NoSuchMethodException

一张图解释mapreduce程序在YARN上启动-运行-注销的全流程

hadoop详细笔记(十八)原理加强mapreduce程序在yarn上的运行流程

(转)MapReduce源码分析总结

【MapReduce】分析每个部门工资总额的数据处理流程并开发程序

好程序员大数据学习路线分享MapReduce全流程总结

SpringMVC运行流程分析

Java程序运行流程

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

让自己的头脑极度开放

CentOS 6.5(x64) 和Redhat6.5操作系误删libc

高可用注册中心

【日记】12.28/【题解】AtCoder AGC041

XML（5）_XML 约束_DTD

Java集合Map（四）

树梅派安装桌面环境教程

pipenv 的使用和安装

小程序白屏问题和内存研究

C语言简单选择排序

每日归档

更多

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)