《Hadoop权威指南》学习笔记（四）

其他 2018-11-13 13:23:58 阅读次数: 0

1 Yarn的MapReduce工作流程

经典的MapReduce顶层包括5个独立实体

客户端，提交MapReduce作业
YARN资源管理器，协调集群上计算资源分配
YARN节点管理器，负责启动和监视集群中的container
MapReduce应用程序master，协调运行中的作业任务
分布式文件系统（一般为HDFS），与其他实体间共享作业文件

提交作业的步骤，一张图就可以了，照着书上画的，加了一些解释，红色框表示节点

第7个步骤之后，如果该任务很小，master则会决定在当前节点运行这个任务，称为uber任务

任务会向master进程汇报当前任务进程，而客户端会以给定时间间隔从master查询作业状态

2 Yarn失败

Yarn中的失败包括：

任务运行失败
master
节点管理器
资源管理器

2.1 任务运行失败

master进程会注意到任务失败并尝试再次启动任务，最大尝试次数由mapreduce.map.maxattemps设定。如果作业失败次数超过mapreduce.map.failures.maxpercent或者mapreduce.reduce.failures.maxpercent，就判定作业失败

2.2 master运行失败

yarn.resourcemanager.am.max-retries设置允许master失败的次数，默认为1次

master向资源管理器发送心跳，master失败后资源管理器在一个新容器总启动master。如果设置了yarn.app.mapreduce.am.job.recovery.enable为true，master可以恢复之前运行的任务状态

客户端会缓存master的地址，如果请求超时会向资源管理器请求新的master地址

2.3 节点管理器运行失败

节点管理器也会向资源管理器发送心跳，yarn.resourcemanager.nm.liveness-monitor.expiry-interval-ms决定资源管理器认为节点管理器失败的等待时间

如果应用程序的运行失败次数过高，节点管理器可能被master拉黑，mapreduce.job.maxtaskfailures.per.tracker设置拉黑阈值

2.4 资源管理器运行失败

那就歇菜了（大误）

管理员启动一个新的资源管理器，并恢复保存的状态，资源管理器只保存节点管理器和master，任务由master管理，这样有助于降低资源管理器的压力

猜你喜欢

转载自blog.csdn.net/jiangxuege/article/details/81531612

《Hadoop权威指南》学习笔记（四）

《Hadoop权威指南》学习笔记（一）

《Hadoop权威指南》学习笔记（零）

《Hadoop权威指南》学习笔记（二）

《Hadoop权威指南》学习笔记（三）

《Hadoop权威指南（第四版英文版）》—— HDFS学习笔记

《Hadoop 权威指南 - 大数据的存储与分析》学习笔记

《Hadoop Yarn权威指南》学习笔记（一）——Yarn架构

《Hadoop Yarn权威指南》学习笔记（零）——Yarn核心概念

Hadoop权威指南学习笔记：总章（未完结）

Hadoop权威指南-大数据的存储与分析第四版——学习笔记——第2章——1

《Hadoop权威指南》读书笔记

《Hadoop权威指南》读书笔记一

Hadoop权威指南-读书笔记

hadoop权威指南第4版笔记

hadoop书籍（二）—《hive权威指南》笔记

读书笔记：Hadoop权威指南简介

权威指南vuejs 学习笔记

Elasticsearch权威指南学习笔记

kafka权威指南学习笔记

《JavaScript权威指南》学习笔记

javascript权威指南--学习笔记

jQuery权威指南学习笔记

【vue 权威指南】学习笔记

HTTP权威指南-学习笔记

《MyCat权威指南》学习笔记

《Elasticsearch权威指南》学习笔记

一、Hadoop权威指南学习图谱

Netty权威指南读书笔记（四）

elasticsearch 权威指南聚合阅读笔记(四)

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)