【hadoop2.x HA 高可用介绍】 - 代码天地

【hadoop2.x HA 高可用介绍】

企业开发 2018-05-09 17:17:54 阅读次数: 3

Hadoop中的NameNode好比是人的心脏，非常重要，绝对不可以停止工作。在hadoop1时代，只有一个NameNode。如果该NameNode数据丢失或者不能工作，那么整个集群就不能恢复了。这是hadoop1中的单点问题，也是hadoop1不可靠的表现。hadoop2就解决了这个问题。

　　hadoop2.2.0中HDFS的高可靠指的是可以同时启动2个NameNode。其中一个处于工作状态，另一个处于随时待命状态。这样，当一个NameNode所在的服务器宕机时，可以在数据不丢失的情况下，手工或者自动切换到另一个NameNode提供服务。

　　这些NameNode之间通过共享数据，保证数据的状态一致。多个NameNode之间共享数据，可以通过Nnetwork File System或者Quorum Journal Node。前者是通过linux共享的文件系统，属于操作系统的配置;后者是hadoop自身的东西，属于软件的配置。

　　我们这里讲述使用Quorum Journal Node的配置方式，方式是手工切换。

　　集群启动时，可以同时启动2个NameNode。这些NameNode只有一个是active的，另一个属于standby状态。active状态意味着提供服务，standby状态意味着处于休眠状态，只进行数据同步，时刻准备着提供服务，如图2所示。

　　

　　

　　在一个典型的HA集群中，每个NameNode是一台独立的服务器。在任一时刻，只有一个NameNode处于active状态，另一个处于 standby状态。其中，active状态的NameNode负责所有的客户端操作，standby状态的NameNode处于从属地位，维护着数据状态，随时准备切换。

　　两个NameNode为了数据同步，会通过一组称作JournalNodes的独立进程进行相互通信。当active状态的NameNode的命名空间有任何修改时，会告知大部分的JournalNodes进程。standby状态的NameNode有能力读取JNs中的变更信息，并且一直监控 edit log的变化，把变化应用于自己的命名空间。standby可以确保在集群出错时，命名空间状态已经完全同步了。

　　

　　为了确保快速切换，standby状态的NameNode有必要知道集群中所有数据块的位置。为了做到这点，所有的datanodes必须配置两个NameNode的地址，发送数据块位置信息和心跳给他们两个。

　　对于HA集群而言，确保同一时刻只有一个NameNode处于active状态是至关重要的。否则，两个NameNode的数据状态就会产生分歧，可能丢失数据，或者产生错误的结果。为了保证这点，JNs必须确保同一时刻只有一个NameNode可以向自己写数据。

猜你喜欢

转载自gaojingsong.iteye.com/blog/2386486

【hadoop2.x HA 高可用介绍】

hadoop学习笔记（六）：hadoop2.x的高可用HA（high avaliable）和联邦F(Federation)

hadoop2.x Yarn HA搭建

Hadoop高可用（Hadoop2.x）

Hadoop HA高可用

hadoop的高可用(HA)

Hadoop HA高可用配置

hadoop ha 高可用配置

Hadoop高可用集群（HA）

配置Hadoop的HA(高可用)

Hadoop集群的高可用-HA

hadoop高可用HA的搭建

Hadoop HDFS高可用（HA）

HA搭建hadoop的高可用

hadoop高可用HA的配置

hadoop高可用(HA)部署

Hadoop--HA(高可用)

Hadoop高可用安装（HA）

Hadoop2.X HA zookeeper集群搭建

Hadoop2.x新特性：HA、Federation、快照

Hadoop基础教程-第9章 HA高可用（9.1 HDFS 高可用介绍）（草稿）

超详细大数据学习之Hadoop HA 高可用安装——————HA & Federation 介绍

hadoop2.x高可用集群的搭建

hadoop2.5.0 HA高可用配置

HUE 针对hadoop ha高可用的设置

Hadoop2.7.6_07_HA高可用

Hadoop HA（高可用）环境的搭建

Hadoop HA 高可用集群部署搭建

Hadoop HA高可用搭建流程

Hadoop HA高可用集群搭建

今日推荐

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

周排行

rbac——界面、权限

Apache CXF + SpringMVC 整合发布WebService

so插件化

Vue.js实战系列---图标字体制作（svg格式）

PAT乙级 1007 素数对猜想(孪生素数对) (20分) ---（C语言 + 详细注释）

被IRM保护的文档，打开失败

Calendar和Date计算日期差的小问题

win10子系统ubuntu18.4安装docker

利用Wrap Shell Script定位Android Native内存泄漏

MySQL: Transaction (Part I - Basic Concept)

每日归档

更多

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)