Hadoop CDH与Apache伪分布式部署

1、Hadoop发行版

目前Hadoop发行版非常多,有Intel发行版,华为发行版、Cloudera发行版(CDH)、Hortonworks版本等,所有这些发行版均是基于Apache Hadoop衍生出来的,之所以有这么多的版本,是由于Apache Hadoop的开源协议决定的:任何人可以对其进行修改,并作为开源或商业产品发布/销售。

目前而言,不收费的Hadoop版本主要有三个,都是国外厂商,分别是:

  • Apache(最原始的版本,所有发行版均基于这个版本进行改进);
  • Cloudera版本(Cloudera’s Distribution Including Apache Hadoop,简称CDH);
  • Hortonworks版本(Hortonworks Data Platform,简称“HDP”);

对于国内用户而言,绝大多数选择CDH版本,Cloudera的CDH和Apache的Hadoop的区别如下:

  1. CDH对Hadoop版本的划分非常清晰,截止目前为止,CDH共有5个版本,其中,前三个已经不再更新,最近的两个,分别是CDH4和CDH5,CDH4基于Hadoop2.0,CDH5基于hadoop2.2/2.3/2.5/2.6.相比而言,Apache版本则混乱得多;同时,CDH发行版比Apache hadoop在兼容性,安全性,稳定性上有很大增强。  
  2. CDH3是CDH第三个版本,基于Apache hadoop0.20.2改进而来&#x

猜你喜欢

转载自blog.csdn.net/qq_35029061/article/details/132252414