大数据 Yarn

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/Notzuonotdied/article/details/82780839

前言

为从根本上解决旧MapReduce框架的性能瓶颈,促进Hadoop框架的更长远发展,从 0.23.0 版本开始,HadoopMapReduce框架完全重构,发生了根本的变化。新的Hadoop MapReduce框架命名为MapReduceV2或者叫Yarn

Yarn是一个资源调度平台,负责为运算程序提供服务器运算资源,相当于一个分布式的操作系统平台,而MapReduce等运算程序相当于运行于操作系统之上的应用程序。

Yarn的重要概念

  1. Yarn并不清楚用户提交的程序运行机制。
  2. Yarn只提供运算资源的调度(用户程序向Yarn申请资源,Yarn负责分配资源)。
  3. Yarn中的Master是ResourceManage。
  4. Yarn中提供运算资源的角色是NodeManage。
  5. 这样一来,Yarn其实就与运行的用户程序完全解耦,就意味着Yarn上可以运行各种类型的分布式运算程序(MapReduce只是其中的一种),比如MapReduce、Storm程序、Spark程序……
  6. 所以Spark、Storm等运算框架都可以整合在Yarn上运行,只要他们各自的框架中符合Yarn规范的资源请求机制即可。
  7. Yarn就成为了一个通用的资源调度平台。企业以前存在的各种预算集群都可以整合在一个物理集群上,提高资源利用率,方便数据共享。

很棒的文章

直接看底下的文章吧~O(∩_∩)O哈哈~

附录

猜你喜欢

转载自blog.csdn.net/Notzuonotdied/article/details/82780839
今日推荐