Hadoop框架体系

Hadoop框架

1. 起源

Doug Cutting是Lucene(全文搜索技术 Solr ES)、Nutch作者,后续设计开发了Hadoop体系。
Hadoop1.x
  HDFS(Hadoop Distributed File System)    GFS 
  MapReduce                               MapReduce
  HBase                                   BigTable
apache组织正式开源Hadoop,并把Hadoop作为了顶级项目。

2. Hadoop的发行版本

名称 是否收费 使用难度
apache开源Hadoop 免费
Cloudera(CDH) $4000(1)
Hortonworks $12000(10)
华为FusionInsight
阿里 (飞天)

3. Hadoop生态圈

1. Hadoop Core (HDFS,MR MapReduce)
2. Hadoop生态工具 (Hive,HBase)
3. Hadoop辅助工具 (Flume,Sqoop,Oozie,Hue)

4. 大数据核心技术

1. HDFS 文件系统  (IO) 存数据 取数据
2. MapReduce 编程,数据的计算 原有的 Java开发 区别
3. Hive SQL (HQL Hive Query Lanuage) 类似SQL 95%和SQL语法一致
4. Hbase (NoSQL) 类比 Redis 存 取数据

在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/weixin_44809337/article/details/109300635
今日推荐