Hadoop框架
1. 起源
Doug Cutting是Lucene(全文搜索技术 Solr ES)、Nutch作者,后续设计开发了Hadoop体系。
Hadoop1.x
HDFS(Hadoop Distributed File System) GFS
MapReduce MapReduce
HBase BigTable
apache组织正式开源Hadoop,并把Hadoop作为了顶级项目。
2. Hadoop的发行版本
名称 |
是否收费 |
使用难度 |
apache开源Hadoop |
免费 |
难 |
Cloudera(CDH) |
$4000(1) |
中 |
Hortonworks |
$12000(10) |
中 |
华为FusionInsight |
|
中 |
阿里 (飞天) |
|
中 |
3. Hadoop生态圈
1. Hadoop Core (HDFS,MR MapReduce)
2. Hadoop生态工具 (Hive,HBase)
3. Hadoop辅助工具 (Flume,Sqoop,Oozie,Hue)
4. 大数据核心技术
1. HDFS 文件系统 (IO) 存数据 取数据
2. MapReduce 编程,数据的计算 原有的 Java开发 区别
3. Hive SQL (HQL Hive Query Lanuage) 类似SQL 95%和SQL语法一致
4. Hbase (NoSQL) 类比 Redis 存 取数据