大数据学习之MapReduce基础与Yarn集群安装09 - 代码天地

大数据学习之MapReduce基础与Yarn集群安装09

其他 2019-05-02 00:41:27 阅读次数: 0

1大数据解决的问题？

海量数据的存储：hadoop->分布式文件系统HDFS

海量数据的计算：hadoop->分布式计算框架MapReduce

2什么是MapReduce?

分布式程序的编程框架，java->ssh ssm ，目的：简化开发！

是基于hadoop的数据分析应用的核心框架。

mapreduce的功能：将用户编写的业务逻辑代码和自带默认组件整合成一个完整的

分布式运算程序，并发的运行在hadoop集群上。

3 MapReduce的优缺点

优点：

（1）易于编程

（2）良好的拓展性

（3）高容错性

（4）适合处理PB级别以上的离线处理

缺点：

（1）不擅长做实时计算

（2）不擅长做流式计算（mr的数据源是静态的）

（3）不支持DAG（有向图）计算（spark）

MapReduce核心编程思想图：

4自动化调度平台yarn(mr程序的运行平台)

mr程序应该在多台机器上运行启动，而且要先执行maptask，等待每个maptask都处理完成后

还要启动很多个reducetask，这个过程要用户手动调用任务不太现实，

需要一个自动化的任务调度平台->hadoop当中2.x中提供了一个分布式调度平台-YARN

Yarn任务提交流程图

5搭建yarn集群

（1）修改配置文件 yarn-site.xml

<property>

<name>yarn.resourcemanager.hostname</name>

<value>bigdata11</value>

</property>

<property>

<name>yarn.nodemanager.aux-services</name>

<value>mapreduce_shuffle</value>

</property>

（2）然后复制到每台机器 $PWD 当前目录

scp yarn-site.xml root@bigdata12:$PWD

scp yarn-site.xml root@bigdata13:$PWD

（3）修改slaves文件（之前配置了就不用再配了）

然后在bigdata11上，修改hadoop的slaves文件，列入要启动nodemanager的机器

然后将bigdata11到所有机器的免密登陆配置好

（4）脚本启动yarn集群：

启动：

sbin/start-yarn.sh

停止：

sbin/stop-yarn.sh

（5）访问web端口

启动完成后，可以在windows上用浏览器访问resourcemanager的web端口：

http://bigdata11:8088

猜你喜欢

转载自www.cnblogs.com/hidamowang/p/10801337.html

大数据学习之MapReduce基础与Yarn集群安装09

大数据学习（05）——MapReduce/Yarn架构

大数据学习笔记09：MapReduce概述

大数据学习之Yarn

大数据学习——yarn集群启动

大数据学习之MapReduce

大数据技术之Hadoop（MapReduce）第5章 Yarn

大数据开发之Hadoop篇----配置yarn和mapreduce

大数据技术之Hadoop：MapReduce与Yarn概述（六）

大数据学习之路9-yarn集群基本概念解释，安装启动

大数据集群管家--MapReduce运行架构, Yarn资源调度流程

大数据技术之Hadoop：Yarn集群部署（七）

【大数据入门二——yarn和mapreduce】

大数据学习5（基于yarn的高可用集群搭建）

【大数据学习】之MapReduce Job

大数据学习路线之mapreduce概述

大数据学习之hdfs集群安装部署04

大数据生态系统基础：Hadoop（七）：Hadoop MapReduce 工作原理和 YARN架构

MapReduce编程及Yarn集群

大数据之---Yarn伪分布式部署和MapReduce案例

Haddoop大数据教程笔记_05_Hadoop之MapReduce原理及Yarn相关

大数据技术学习笔记之Hadoop框架基础2-MapReduce编程及运行流程

大数据基础学习-3.Hadoop2.0、Yarn

【原创】大数据基础之集群搭建

大数据——MapReduce基础（MapReduce理论篇）

大数据——MapReduce基础（MapReduce概念）

大数据高可用集群环境安装与配置（09）——安装Spark高可用集群

【大数据学习】之YARN伪分布式部署

大数据核心技术之MapReduce基础编程（实验）

【大数据基础】MapReduce 实验

今日推荐

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

周排行

Java基础复习_day13_Collection集合

2018.11.16 c语言学习经验

且看Java内置四大核心函数式接口

小程序云开发中数据库的数据分段和显示图片

python的函数

Web-JS进阶

【干货】C++常用代码积累笔记大全

Spring的ioc操作与 IOC底层原理

构建之法20191121-11 Scrum立会报告+燃尽图 07

Spring boot之Hello World访问404

每日归档

更多

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)