带你了解Hadoop前世今生 - 代码天地

带你了解Hadoop前世今生

编程语言 2021-10-08 11:50:34 阅读次数: 0

小知识，大挑战！本文正在参与“程序员必备小知识”创作活动。

推荐阅读时间：10分钟

字数：610字

什么是Hadoop?

Apache™ Hadoop® 项目开发用于可靠、可扩展、分布式计算的开源软件。

Apache Hadoop 软件库是一个框架，允许使用简单的编程模型跨计算机集群分布式处理大型数据集。它旨在从单个服务器扩展到数千台机器，每台机器都提供本地计算和存储。因为每台计算机都可能容易出现故障，所以该库本身不是依靠硬件来提供高可用性，而是设计用于检测和处理应用层的故障，从而在计算机集群之上提供高可用性服务。

Hadoop的起源

2003-2004年，Google公布了部分GFS和MapReduce思想的细节，受此启发的Doug Cutting等人用2年的业余时间实现了DFS和MapReduce机制，使Nutch性能飙升。然后Yahoo招安Doug Gutting及其项目。
2005年，Hadoop作为Lucene的子项目Nutch的一部分正式引入Apache基金会。
2006年2月被分离出来，成为一套完整独立的软件，起名为Hadoop

总结起来，Hadoop起源于Google的三大论文

GFS：Google的分布式文件系统Google File System
MapReduce：Google的MapReduce开源分布式并行计算框架
BigTable：一个大型的分布式数据库

Hadoop的发展历程

Hadoop的版本是多条分支并行的发展的，到目前为止，Hadoop的版本有1.x、2.x、3.x，下面以思维导图的方式展示各个版本的特性以及缺陷

Hadoop1.x Hadoop1.x.png

Hadoop2.x、Hadoop3.x

至此，Hadoop三个版本的特性以及缺陷笔者已经以导图的方式展示，对于版本的选择，建议直接选择Hadoop2.0之后的版本进行学习。如果是用于生产环境部署，则可根据实际的业务环境选择稳定的版本。

本人是该领域的小白，在学习的路上，上述文章如有错误还请指出批评。

猜你喜欢

转载自juejin.im/post/7014668756697743397

带你了解Hadoop前世今生

一文带你了解服务降级的前世今生

【译】带你了解LiveData重放污染的前世今生

本文带你了解透彻云计算（前世，今生，未来）

带你了解大语言模型的前世今生

不要再说自己不懂IT/一分钟带你了解VIM的前世今生

前端技术及开发模式的演进，带你了解前端技术的前世今生

一步一图，带你了解分布式架构的前世今生！

什么是Nodejs?Nodejs的由来，简单的带你了解Nodejs今生前世,npm配置源

使用体验神似VS Code？三步带你了解华为云CloudIDE前世今生

计算机大佬Brian Kernighan的新书《UNIX传奇》带你了解UNIX的前世今生

一文带你了解机器翻译的前世今生

虹科分享 | 一文带你了解增强现实（AR）技术的前世今生

了解DevOps的前世今生

Hadoop的前世今生

KepServerEX读写三菱PLC，车间现场测试记录，带你了解【数据采集的困境】的前世与今生

一文带你了解MySQL的前世今生，架构，组成部分，特点，适用场景

几分钟带你搞定HTTP的前世今生

一篇让你彻底了解HTTP 的前世今生

一文让你了解Docker的前世今生

物联网是什么，华为云学院带你走进物联网的前世今生

区块链是什么？华为云学院带你领略区块链的前世今生

云电脑引领者新睿云电脑带你看云电脑的“前世今生”

新睿云电脑带你走进云电脑的前世今生

16张精美的数据可视化，带你走进它的前世今生

30秒了解大数据的前世今生

30秒了解Excel的前世今生

5分种让你了解javascript异步编程的前世今生，从onclick到await/async

一文读懂Hadoop的前世今生

给我10分钟，带你看懂Docker和K8S的前世今生

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)