hadoop 2(0.23.x) 与 0.20.x比较 - 代码天地

hadoop 2(0.23.x) 与 0.20.x比较

企业开发 2018-05-14 17:30:04 阅读次数: 2

以下大部分内容来自网络,这里主要是进行学习,比较

1、Hadoop 0.20.*的局限性

HDFS单NameNode的不足
1）扩展性问题。可以随着数据量进行水平扩展，而元数据服务器不能扩展。

   2）随着文件数目的增长，元数据服务器的压力变大。据统计，2.5亿个文件在NameNode中Namespace占据的大概64GB的内存空间。
    3）文件操作的吞吐率受到单个元数据服务器的限制。目前，Hadoop 0.20.*版本可以达到120k readops/sec，6000 writeops/sec.
    4)隔离性的问题。

MapReduce编程模型与运行时环境紧耦合
1）集群资源利用率较低。整个集群资源按照固定Slot为单位进行资源分配，没有考虑MapTask、ReduceTask任务的特点和逻辑关系进行不同的配置。

2)仅支持MapReduce编程模型。

单个JobTracker的单点故障和扩展性

1）JobTracker的负载较重。JobTracker负责作业和任务的初始化、以及提供TaskTracker的RPC Server、任务的调度等任务。因此，JobTracker一旦故障，所有执行的任务的状况丢失。

2）扩展性问题。

2.Hadoop-2(0.23)的New Features

HDFS Federation

1) Namespace与block Management解耦。

MapReduce NextGen aka YARN

1）编程模型与运行时框架解耦。

2）运行时环境的扩展性与单点故障问题。

可见,hadoop 2是针对性地解决了hadoop 0.20.x中的问题.

ref:

Hadoop0.23.0初探1---前因后果

补充一下线上资源:

1.0.X - current stable version, 1.0 release
1.1.X - current beta version, 1.1 release
2.X.X - current alpha version
0.23.X - simmilar to 2.X.X but missing NN HA.
0.22.X - does not include security
0.20.203.X - legacy stable version
0.20.X - legacy version

猜你喜欢

转载自leibnitz.iteye.com/blog/1573193

hadoop 2(0.23.x) 与 0.20.x比较

Web3.js 0.20.x API 中文版翻译

hadoop 2.x-the hadoop rpc protocols

Hadoop高可用（Hadoop2.x）

Hadoop 2.x与Hadoop 3.x之间的功能比较

hadoop2.x概览

Hadoop2.X笔记

Hadoop2.X搭建

Hadoop-2.x-HDFS

hadoop1.x 和 hadoop2.x的对比

HADOOP1.X与HADOOP2.X的区别

Hadoop1.X版本与Hadoop2.X的区别

Hadoop1.x与Hadoop2.x之间的差异

Hadoop1.x与Hadoop2.x区别

Hadoop1.X和Hadoop2.X

Hadoop—Hadoop1.X和2.X安装

Hadoop3x，Hadoop2x新特性

Hadoop 1.x 与 Hadoop 2.x的架构对比

Hadoop1.x/Hadoop2.x/Hadoop3.x的区别

大数据Hadoop2.x与Hadoop3.x相比较有哪些变化

hadoop2.x的编译 & hadoop-snappy编译 & hadoop2.x 配置 snappy压缩

Hadoop1.x与Hadoop2的区别

（1）Hadoop笔记：Hadoop2.X搭建和配置

【Hadoop】hadoop2.x入门与基本环境配置

Hadoop记录-hadoop2.x常用端口及定义方法

Hadoop 2.x与3.x 22点比较：3.x将节省大量存储空间

hadoop 2.x集群安装与配置

hadoop 2.x wordcount练习

hadoop2.x jobhistoryserver 配置

hadoop2.X安装遇到的问题

今日推荐

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

周排行

SVN服务端安装在阿里云

实战 | 相机标定

webpack核心概念

note20——》只要肯低头吃苦，人生就会有救

PAT甲级 1062 Talent and Virtue （25 分）排序

NG Toolset开发笔记--5GNR Resource Grid（26）

如何对待上司

oracle命令

第9章 STL迭代器

logstash使用es映射模板

每日归档

更多

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)