Yarn的基本架构

先来一一张图:

在这里插入图片描述
基本结构组成:ResourceManager,ApplicationMaster,NodeManager,Container

1.ResourceManager(RM)

RM是一个全局的资源管理器,负责整个系统的资源管理和分配。它主要由两个组件构成:调度器(Scheduler)和应用程序管理器(Applications Manager,ASM)。

调度器(Scheduler)仅负责分配资源,不负责程序的监控或者跟踪应用程序的执行状态,也不负责重新启动因应用执行失败或者硬件故障而产生的失败任务(这些均交由应用程序相关的ApplicationMaster)。

调度器仅根据各个应用程序的资源需求进行资源分配,而资源分配单位用一个抽象概念“资源容器”(Resource Container,简称Container)表示,Container是一个动态资源分配单位,它将内存、CPU、磁盘、网络等资源封装在一起,从而限定每个任务使用的资源量。此外,该调度器是一个可插拔的组件,用户可根据自己的需要设计新的调度器,YARN提供了多种直接可用的调度器,比如Fair Scheduler和Capacity Scheduler等。

2.ApplicationMaster(AM)

用户提交的每一个应用程序都包括一个AM,AM主要有以下功能:

1.与RM协调器协商以获取资源(用Container表示);

2.将得到的任务进一步分配给内部任务;

3.与NM通信以启动/停止任务;

4.监控任务的状态,并在任务失败时重新为任务申请资源以重启任务。

当前YARN自带了两个AM实现,一个是用于演示AM编写方法的实例程序distributedshell,它可以申请一定数目的Container以并行运行一个Shell命令或者Shell脚本;另一个是运行MapReduce应用程序的AM—MRAppMaster

3.NodeManager(NM)

NM是每个节点上的资源和任务管理器,它会定时向RM汇报本节点的资源使用情况和各个Container的运行状态,它还接收并处理来自AM的Container启动/停止等请求

4.Container
Container是YARN中的资源抽象,它封装了某个节点上的多维度资源,如内存、CPU、磁盘、网络等,当AM向RM申请资源时,RM为AM返回的资源便是用Container表示的。YARN会为每个任务分配一个Container,且该任务只能使用该Container中描述的资源。

发布了133 篇原创文章 · 获赞 53 · 访问量 2万+

猜你喜欢

转载自blog.csdn.net/weixin_43599377/article/details/103517501