Hadoop中的发展历史 - 代码天地

Hadoop中的发展历史

其他 2019-01-17 12:18:17 阅读次数: 0

Hadoop使用分布式文件HDFS系统，用于存储大数据（数据至少要到TB吧）。版本1的时候，使用MapReduce来做计算处理。版本2的时候，使用yarn来做计算处理。但是这两个版本都是使用磁盘空间作为计算。版本3的时候，Hadoop支持Spark来计算处理。Spark即支持磁盘做数据处理，也支持内存来做数据处理。Spark支持Python，JAVA，Scala语言

Hbase存储HDFS数据，使用HBase在HDFS上读取数据随机访问数据。HBase在Hadoop的文件系统之上，并提供了读写访问，它是Hadoop的生态系统，提供对数据的随机实时读／写访问。

在 Hbase 中，Row-key 加上 CF 加上 Qulifier 再加上一个时间戳才可以定位到一个单元格数据（Hbase 中每个单元格默认有 3 个时间戳的版本数据）

猜你喜欢

转载自blog.csdn.net/yinni11/article/details/86155748

Hadoop中的发展历史

hadoop的介绍以及发展历史

Hadoop-详细入门介绍，发展历史，组成架构，生态圈-连载中

SEO 的发展历史

编码发展的历史

Linux发展历史

编程语言发展历史

EJB的发展历史

Java的历史及发展

字符发展历史

java web的发展历史

区块链的发展历史

Maven发展历史

Intel CPU发展历史

Python发展历史

Linux系统发展历史

Linux的发展历史

Linux发展历史年表

Python 发展历史

C++——发展历史

编程语言的发展历史

大数据发展历史

C++发展历史

前端历史发展（转载）

前端发展历史

语言发展历史

js的发展历史，笔记

SSD历史发展

线程的发展历史

Spark的历史与发展

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)