1、Hadoop发行版
目前Hadoop发行版非常多,有Intel发行版,华为发行版、Cloudera发行版(CDH)、Hortonworks版本等,所有这些发行版均是基于Apache Hadoop衍生出来的,之所以有这么多的版本,是由于Apache Hadoop的开源协议决定的:任何人可以对其进行修改,并作为开源或商业产品发布/销售。
目前而言,不收费的Hadoop版本主要有三个,都是国外厂商,分别是:
- Apache(最原始的版本,所有发行版均基于这个版本进行改进);
- Cloudera版本(Cloudera’s Distribution Including Apache Hadoop,简称CDH);
- Hortonworks版本(Hortonworks Data Platform,简称“HDP”);
对于国内用户而言,绝大多数选择CDH版本,Cloudera的CDH和Apache的Hadoop的区别如下:
- CDH对Hadoop版本的划分非常清晰,截止目前为止,CDH共有5个版本,其中,前三个已经不再更新,最近的两个,分别是CDH4和CDH5,CDH4基于Hadoop2.0,CDH5基于hadoop2.2/2.3/2.5/2.6.相比而言,Apache版本则混乱得多;同时,CDH发行版比Apache hadoop在兼容性,安全性,稳定性上有很大增强。
- CDH3是CDH第三个版本,基于Apache hadoop0.20.2改进而来&#x