第二章：大数据处理架构Hadoop - 代码天地

第二章：大数据处理架构Hadoop

企业开发 2023-04-08 09:51:37 阅读次数: 0

本章内容：
1.Hadoop的发展历程
2.Hadoop生态系统的各个组件及其功能
3.Hadoop的安装和使用方法
4.Hadoop集群的部署和使用方法

1.Hadoop简介
Hadoop是Apache软件基金会旗下开源软件
Hadoop可以支持多种编程语言：C、C++、Java、Python

Hadoop两大核心—HDFS+MapReduce:
解决了两大问题：HDFS如何实现海量数据的存储（集群分布式存储），MapReduce如何实现海量数据的处理（集群分布处理）

2003年，谷歌发布了分布式文件系统GFS（Google File System）。HDFS是GFS的开源实现
2004年，谷歌发布了分布式并行编程框架MapReduce。
在这里插入图片描述
对1TB的数据进行排序，用时209秒

Hadoop的特性：
1.Hadoop具有很高的可靠性：多台机器构成集群，部分机器发生故障，剩余机器可以继续对外提供服务
2.Hadoop具有很高的效率：成百上千台机器一起计算
3.Hadoop具有很好的可扩展性：可以不断往集群中增加机器
4.Hadoop成本低：Hadoop可以采用普通PC机来构成一个集群
5.高性能计算（High Performance Computing 编写HPC）

Hadoop应用现状
Facebook公司采用Hadoop集群用于日志处理、推荐系统和数据仓库等方面
在这里插入图片描述
2.Hadoop不同的版本

Hadoop1.0两大核心：HDFS+MapReduce

到2.0以后，MapReduce只做数据处理工作，不再做资源调度。MapReduce是架构在YARN资源调度之上的。

在这里插入图片描述

在这里插入图片描述

学生Apach、企业Hortonworks,星环

3.Hadoop项目结构
在这里插入图片描述

YARN负责对内存、CPU、资源、带宽资源进行调度
Spark与MapReduce的区别：
Spark是基于内存的；MapReduce是基于磁盘的
Hive是数据仓库方面的。可用于企业数据分析。
在这里插入图片描述

4.Hadoop集群的部署和使用

Hadoop不仅可以在本地使用也可以部署到云端

猜你喜欢

转载自blog.csdn.net/qq_44636569/article/details/125255494

第二章：大数据处理架构Hadoop

第二章-大数据处理框Hadoop

《大数据技术应用与原理》第二版-第二章大数据处理架构Hadoop

大数据技术原理与应用第二章大数据处理架构Hadoop 学习指南

二、Hadoop大数据处理架构

大数据技术原理与应用：【第二讲】大数据处理架构Hadoop

大数据第二章hadoop概述

大数据总结【第二章：Hadoop】

余老师带你学习大数据-Spark快速大数据处理第二章第二节ZooKeeper环境搭建

大数据处理架构Hadoop

大数据处理架构Hadoop理解

大数据技术与架构——（二）大数据处理架构Hadoop（上）

余老师带你学习大数据-Spark快速大数据处理第二章第五节zookeeper主从应用

余老师带你学习大数据-Spark快速大数据处理第二章第四节zookeeper分布式锁

余老师带你学习大数据-Spark快速大数据处理第二章第三节zookeeper客户端基本操作

余老师带你学习大数据-Spark快速大数据处理第二章第一节Zookeeper总体介绍

余老师带你学习大数据-Spark快速大数据处理第三章第二节Hadoop环境搭建

Hadoop1-认识Hadoop大数据处理架构

大数据环境部署第二章——Hadoop 伪分布式环境搭建

第二章：Hadoop

大数据处理架构

Python数据处理从零开始----第二章（pandas）⑦pandas读写csv文件(1)

大数据学习第二章、HDFS相关概念

spark大数据快速分析第二章

大数据学习2——大数据处理架构Hadoop概述

大数据技术原理与应用——大数据处理架构Hadoop

大数据技术原理与应用之【大数据处理架构Hadoop】习题

大数据技术原理与应用——大数据处理架构 Hadoop

余老师带你学习大数据-Spark快速大数据处理第六章第二节Spark编程模型与Spark基本架构

Hadoop 第二章 HDFS

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

周排行

Python环境安装与基础语法（1）——计算机基础知识

IMU预积分

ADAS中的LDW、FCW、BSD、LCA、ACC、AEB、APA、DMS代表的含义

B站笔试两道题

skyeye arm 硬件虚拟机环境的搭建

Web前端静态页面示例

数组-合并排序数组 II-简单

springcloud之版本问题启动报错

面向对象-------------匿名对象(六)

输入URL到页面呈现中间发生了什么？

每日归档

更多

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)