黑马程序员-大数据入门到实战-MapReduce & YARN入门

编程语言 2023-07-18 17:55:09 阅读次数: 0

文章目录

1. 分布式计算概述
2. MapReduce概述
3. YARN概述
4. YARN架构
- 4.1 核心架构
- 4.2 辅助架构
5. MapReduce & YARN的部署
6. MapReduce & YARN初体验
- 6.1 集群启停命令
- 6.2 提交MapReduce任务到YARN执行

1. 分布式计算概述

计算与分布式计算

计算：对数据进行处理，使用统计分析等手段得到需要的结果
分布式计算：多台服务器协同工作，共同完成一个计算任务

分布式计算的两种工作模式

分散→汇总（MapReduce）
中心调度→步骤执行（Spark、Flink）

2. MapReduce概述

MapReduce

Hadoop中分布式计算组件
分散→汇总模式

主要接口

map接口：“分散”功能
reduce接口：“汇总”功能

运行机制

将执行的需求分解为多个 Map Task 和 Reduce Task
将 Map Task 和 Reduce Task 分配到对应的服务器去执行

3. YARN概述

YARN

Hadoop一个组件
用于集群的资源调度

MapReduce与YARN的关系

YARN用来调度资源给MapReduce分配和管理运行资源
MapReduce需要YARN才能执行

4. YARN架构

4.1 核心架构

核心架构角色

主：ResourceManager
从：NodeManager

功能

ResourceManager：管理、统筹并分配整个集群的资源
NodeManager：管理、分配单个服务器的资源，即创建管理容器，由容器提供资源供程序使用

4.2 辅助架构

ProxyServer：保障web UI访问的安全性
JobHistoryServer：记录历史程序运行信息和日志

5. MapReduce & YARN的部署

5.1 集群规划

node1：ResourceManager、NodeManager、ProxyServer、JobHistoryServer
node2：NodeManager
node3：NodeManager

5.2 MapReduce配置文件

在 $HADOOP_HOME/etc/hadoop文件夹内，修改：

mapred-env.sh文件
mapred-site.xml文件
yarn-env.sh文件
yarn-site.xml文件

5.3 分发配置文件

5.4 集群启动命令介绍

一键启动YARN集群：$HADOOP_HOME/sbin/start-yarn.sh
一键停止YARN集群：
$HADOOP_HOME/sbin/stop-yarn.sh

5.5 开启YARN集群

在node1服务器，以hadoop用户执行

start-yarn.sh
mapred --daemon start historyserver

查看YARN的运行

http://node1:8088

6. MapReduce & YARN初体验

6.1 集群启停命令

启动

start-yarn.sh
mapred --daemon start historyserver

停止

stop-yarn.sh
mapred --daemon stop historyserver

6.2 提交MapReduce任务到YARN执行

略

猜你喜欢

转载自blog.csdn.net/m0_68111267/article/details/131736590

黑马程序员-大数据入门到实战-MapReduce & YARN入门

黑马程序员-大数据入门到实战-分布式SQL计算 Hive 入门

黑马程序员-大数据入门到实战-前置章节

黑马程序员-大数据入门到实战-HDFS分布式存储

黑马程序员-大数据入门到实战-分布式SQL计算 Hive 语法与概念

Yarn 入门

【大数据入门二——yarn和mapreduce】

YARN的入门介绍

Yarn集群入门学习

Yarn基础入门

Uni-App从入门到实战-黑马程序员【uniapp基础知识讲义笔记】

[黑马程序员Redis入门到实战教程]——基础篇

关于YARN（Hadoop入门三）

Apache Hadoop Yarn 入门（一）

yarn详细入门教程

黑马程序员——java基础入门

Spark on Yarn ｜ Spark，从入门到精通

Yarn快速入门系列(2)——Yarn的运行流程

Yarn快速系列入门(4) | Yarn调度器

程序员入门必备的大数据开发实战系列丛书

2019大数据入门到精通：资深程序员规划让你熟知学习路线

好程序员大数据视频教程从零基础入门到精通

黑马程序员_PHP从入门到精通【视频教程】

【C++】黑马程序员《C++从入门到精通》

大数据入门（14）hadoop+yarn+zookeeper集群搭建

【大数据入门实践】Yarn伪分布式部署

Yarn 构建工具入门基础

Hadoop入门之Yarn调度MR流程

yarn详细入门教程(转载)

yarn详细入门级教程

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

周排行

购置笔记本常识

从源码看Spring Security之采坑笔记（Spring Boot篇）

大数据学习——高可用配置案例

如何避免选择不专业的建站公司?

Euclid's Game HDU - 1525（博弈）

面试笔记（六）---Js实现eventHandler

Windows 实例搭建的 FTP 在外网无法连接和访问

设计模式 : 桥接模式

USB 设备驱动开发之几个重要结构体分析

14-p14_sqrt求平方根

每日归档

更多

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)