Hadoop笔记 - 代码天地

Hadoop笔记

企业开发 2018-05-13 20:12:51 阅读次数: 2

1.Hadoop 从三个角度将主机划分为二种角色。

第一，最基本划分为Master和Slave;

第二，从HDFS角度上，划分为NameNoe(目录管理者)和DataNode;

第三，从MapReduce角度上，划分为JobTracker和TaskTracker.

2.Hadoop三种运行方式：

单机模式：无需配置，单进程，用于调试;

伪分布式：一个节点的集群，配置简单

完全分布式：

3.起于2002 Apache Nutch.06年独立，HDFS + MapRedue 。HDFS高容错，数据管理，基于Java，移植。MapReduce 处理任务高效及开源。可靠，可扩展，高效，高容错。

08.02 Yahoo 2000个节点上1W个Hadoop虚拟机处理5PB网页。

4.特点原理：

数据分布存储;NameNode ,DataNode HDFS block; 64MB

分布式并行计算;主控JobTracker,用户提交的计算叫Job,每一个Job会被划分成若干个Tasks，JobTracker负责Job和Tasks的调度，而TaskTracker负责执行Tasks;

本地计算，数据存储在哪台上，就在哪台上执行;

任务粒度;64MB,M个小数据集，M个Map任务;

数据分割， Hash(key) mod R;

数据合并，对中间结果合并;

Reduce，形成最终结果文件；

任务管道，结果成为另一个计算任务的输入，开始下一个任务。

5.MapReduce 是大规模数据（TB）计算的利器，Map和Reduce是它的主要思想，来源于函数式编程语言，原理：

Map负责将数据打散，Reduce负责将数据进行聚集，用户只需要实现map和reduce二个接口，即可完成TB级数据的计算，常见的应用包括:日志分析，数据挖掘等数据分析应用，还有科学数据计算等。

猜你喜欢

转载自zhengchao123.iteye.com/blog/1858231

Hadoop笔记 - Hadoop的组成

七种最常见的Ｈａｄｏｏｐ和Ｓｐａｒｋ项目，你见过几种？

hadoop 笔记

Hadoop笔记

Hadoop学习笔记_初识Hadoop

【Hadoop学习笔记】——Hadoop基础

Hadoop学习笔记-Hadoop初识

hadoop安装笔记

hadoop学习笔记（一）

hadoop学习笔记（二）

hadoop学习笔记（三）

Hadoop笔记 HDFS（一）

hadoop研究笔记

hadoop学习笔记4

hadoop学习笔记1

Hadoop 学习笔记（二）

Hadoop学习笔记

hadoop笔记1

Hadoop 学习笔记（一）

(转)hadoop编程笔记

hadoop学习笔记3

hadoop 学习笔记 1

hadoop编程笔记

Hadoop集群安装笔记

Hadoop学习笔记一

hadoop 大数据笔记

hadoop cdh 安装笔记

Hadoop搭建笔记（04）

Hadoop搭建笔记（03）

Hadoop搭建笔记（02）

今日推荐

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

周排行

计算机组成与设计（七）—— 除法器

Integer Approximation(分治+枚举)

大话数据库索引

windows10系统JDK的配置及下载地址

mysql实现秒值转换中原六仔平台搭建

Codeforces Round #556 (Div. 1)

百练1064 网线主管

Codeforces 995F Cowmpany Cowmpensation

子集生成之增量构造法，位向量法，二进制法

ERROR: cmd.exe failed with args /c "/APK\gradle\rungradle.bat...

每日归档

更多

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)