Hadoop技术内幕读书笔记-mapreduce架构 - 代码天地

Hadoop技术内幕读书笔记-mapreduce架构

企业开发 2018-05-10 06:28:12 阅读次数: 0

Hadoop MapReduce也采用了Master/Slave（M/S）架构。它主要由以下几个组件组成：Client、JobTracker、 TaskTracker和Task。下面分别对这几个组件进行介绍。

（1）Client
用户编写的mapReduce程序通过client提交到JobTracker；同时可以通过Client提供的一些接口查看作业运行状态。
（2）JobTracker
JobTracker主要负责资源监控和作业调度。JobTracker监控所有TaskTracker与作业的健康状况，一旦发现失败情况后，其会将相应的任务转移到其他节点；同时，JobTracker会跟踪任务的执行进度、资源使用量等信息，并将这些信息告诉任务调度器，而调度器会在资源出现空闲时，选择合适的任务使用这些资源。
（3）TaskTracker
TaskTracker会周期性地通过Heartbeat将本节点上资源的使用情况和任务的运行进度汇报给JobTracker，同时接收JobTracker发送过来的命令并执行相应的操作（如启动新任务、杀死任务等）。
（4）Task
Task分为Map Task和Reduce Task两种，均由TaskTracker启动。对于MapReduce而言，其处理单位是split。split是一个逻辑概念，它只包含一些元数据信息，比如数据起始位置、数据长度、数据所在节点等。它的划分方法完全由用户自己决定。但需要注意的是，split的多少决定了Map Task的数目，因为每个split会交由一个Map Task处理。
Map Task执行过程如下：

（1）首先将对应split迭代解析为key/value对
（2）依次调用用户自定义的map（）方法，最终生成的临时文件放在本地磁盘
（3）临时文件被分成若干个partition，每个patition将被一个Reduce Task处理
Reduce Task执行过程如下：

（1）从远程节点读取Map Task中间结果（shuffle阶段，洗牌）
（2）按照key对key/value对进行排序（sort阶段）
（3）依次读取<key,value list>,调用Reduce函数处理，将最终结果生成至HDFS上（reduce阶段）

猜你喜欢

转载自qicq611le.iteye.com/blog/2100985

Hadoop技术内幕读书笔记-mapreduce架构

《Hadoop技术内幕》读书笔记——Task运行过程分析

Hadoop技术内幕_深入解析Hadoop Common和HDFS架构设计与实现原理——读书笔记(2)

Hadoop技术内幕_深入解析Hadoop Common和HDFS架构设计与实现原理——读书笔记(1)

java web 技术内幕读书笔记

spring技术内幕2读书笔记

MySQL技术内幕——读书笔记

spring技术内幕读书笔记（二）

spring技术内幕读书笔记（一）

《mysql技术内幕》读书笔记

spring 技术内幕读书笔记1

读书笔记之MySQL技术内幕

《innodb技术内幕》读书笔记

MySQL Innodb技术内幕读书笔记

《深入分析Java Web技术内幕》读书笔记

java web 技术内幕读书笔记二

MySQL技术内幕-InnoDB存储引擎 --- 读书笔记

MySQL技术内幕：InnoDB存储引擎读书笔记（下）

MySQL技术内幕：InnoDB存储引擎读书笔记（中）

MySQL技术内幕：InnoDB存储引擎读书笔记（上）

"mysql技术内幕innodb存储引擎"--读书笔记

读书笔记：《深入分析Java Web技术内幕》

MySQL技术内幕读书笔记（二）——InnoDB存储引擎

MySQL技术内幕读书笔记（四）——表

MySQL技术内幕读书笔记（三）——文件

MySQL技术内幕读书笔记（五）——索引与算法

MySQL技术内幕读书笔记（七）——锁

MySQL技术内幕读书笔记（八）——事务

Mybatis技术内幕读书笔记（六）核心模块

Mybatis技术内幕读书笔记（五）cache模块

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

循环神经网络（rnn）讲解

Tigao教程四：单独的关节运动

金蝶K3WISE15.0-注册套打教程

如何在Mac上配置Kubernetes

Android应用结束自身进程的方法

SpringMVC学习十三拦截器栈

中国驻洛杉矶总领馆举行新春招待会

HttpClient get post 发送

11 - three.js 笔记 - 绘制三维字体模型

Mysql递归获取某个父节点下面的所有子节点和子节点上的所有父节点

每日归档

更多

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)