什么是Hadoop - 代码天地

什么是Hadoop

其他 2018-06-11 14:17:18 阅读次数: 2

大数据框架按功能来划分
海量数据存储：
HDFS、Hive（本质存储数据还是HDFS）、Hbase、ES（ElasticSearch）
海量数据分析
MapReduce、Spark、SQL
最原始的Hadoop框架
数据存储：HDFS（Hadoop Distributed File System）
数据分析：MapReduce
Hadoop的起源
Google的三篇论文
虽然Google没有公布这三个产品的源码，但是他发布了这三个产品的设计论文，奠定了风靡全球的大数据算法的基础！
Google FS——HDFS
MapReduce——MapReduce
BigTable——HBase
理念：将任务分解然后再多态处理能力较弱的计算节点中同时处理，然后将结果合并从而完成大数据处理。
Hadoop介绍
大数据绝大数框架都属于Apache顶级项目
Apache官网
 Hadoop官网
分布式
相对于集中式而言
需要多台机器进行协助完成
元数据：记录数据的数据
架构（主从架构）：

主节点 Master 老大，管理者
管理
从节点 Slave 从属，奴隶，被管理者
干活
Hadoop也是分布式架构
HDFS

-主节点：NameNode
决定着数据存储到哪个DataNode上
-从节点：DataNode
存储数据

MapReduce

-分而治之的思想
-将海量的数据划分为多个部分，每部分睡进行单独的处理，最后将所有的结果进行合并
-map task
单独处理每一部分的数据
-reduce task
合并map task的输出

分而治之

Yarn

-分布式集群资源管理框架，管理者集群的资料（memory，cpu core）
-合理调度分配给各个程序（MapReduce）使用
-主节点：resourceManager
掌管集群中的资源
-从节点：nodeManager
管理每台集群资源
-总结：Hadoop的安装部署
. 都属于java进程，就是启动JVM进程，运行服务。
. HDFS：存储数据，提供分析的数据
NameNode/DataNode
. Yarn：提供程序运行的资源
ResourceManager/NodeManager

猜你喜欢

转载自blog.csdn.net/qq_38314823/article/details/80641042

Hadoop：什么是Hadoop??

什么是Hadoop

什么是Hadoop？

【hadoop】为什么要用hadoop？

hadoop是什么？

Hadoop是什么

Hadoop能做什么

hadoop能做什么?

什么是Hadoop的MapReduce？

什么是Apache Hadoop？

【大数据】什么是hadoop

hadoop主要学什么？

Hadoop与Spark是什么？

hadoop之 hadoop能为企业做什么？

什么是Hadoop，Hadoop相关概念的基本理解

入门Hadoop---Hadoop是什么？

什么是Hadoop？大数据与Hadoop简介

Hadoop系列之什么是Hadoop(1)

大数据之Hadoop（一）：Hadoop概述、什么是Hadoop、Hadoop核心组件、Hadoop优势

Spark 为什么比Hadoop快

读完此文就知道什么是Hadoop了

hadoop namenode format做了什么？

Hadoop HA 是什么？架构？

Spark为什么比Hadoop快？

Spark为什么比Hadoop好？

Hadoop到底是什么？

Hadoop到底是什么?

hadoop是什么？能做什么？

Spark入门——什么是Hadoop，为什么是Spark?

Hadoop是什么，能做什么

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)