Hadoop中的发展历史

Hadoop使用分布式文件HDFS系统,用于存储大数据(数据至少要到TB吧)。版本1的时候,使用MapReduce来做计算处理。版本2的时候,使用yarn来做计算处理。但是这两个版本都是使用磁盘空间作为计算。版本3的时候,Hadoop支持Spark来计算处理。Spark即支持磁盘做数据处理,也支持内存来做数据处理。Spark支持Python,JAVA,Scala语言

Hbase存储HDFS数据,使用HBase在HDFS上读取数据随机访问数据。HBase在Hadoop的文件系统之上,并提供了读写访问,它是Hadoop的生态系统,提供对数据的随机实时读/写访问。

在 Hbase 中,Row-key 加上 CF 加上 Qulifier 再加上一个时间戳才可以定位到一个单元格数据(Hbase 中每个单元格默认有 3 个时间戳的版本数据)

猜你喜欢

转载自blog.csdn.net/yinni11/article/details/86155748