HDFS的高可用（HA）图文并茂

其他 2020-06-23 12:08:06 阅读次数: 0

1：架构

在这里插入图片描述

上图是一张Hadoop高可靠性的工作原理图，其中NN代表的是NameNode，DN代表的是DataNode，ZK代表的是Zookeeper，我们发现这个集群当中有两个NameNode，一个处于Active状态，另一个处于Standby状态，NameNode是受Zookeeper控制的，但是又不是直接受Zookeeper控制，有一个中间件FailoverController（也就是ZKFC进程），每一个NameNode所在的机器都有一个ZKFC进程，ZKFC可以给NameNode发送一些指令，比如切换指令。同时ZKFC还负责监控NameNode，一旦它发现NameNode宕机了，它就会报告给Zookeeper，另一台NameNode上的ZKFC可以得到那一台NameNode宕机的信息，因为Zookeeper数据是同步的，因此它可以从ZK中得到这条信息，它得到这条信息之后，会向它控制的NameNode发送一条指令，让它由Standby状态切换为Active状态。具体原理是什么呢，刚开始的时候两个NameNode都正常工作，处于激活状态的NameNode会实时的把edits文件写入到存放edits的一个介质当中，Standby状态的NameNode会实时的把介质当中的edits文件同步到它自己所在的机器。因此Active里面的信息与Standby里面的信息是实时同步的。FailoverController实时监控NameNode，不断把NameNode的情况汇报给Zookeeper，一旦Active状态的NameNode发生宕机，FailoverController就跟NameNode联系不上了，联系不上之后，FailoverController就会把Active宕机的信息汇报给Zookeeper，另一个FailoverController便从ZK中得到了这条信息，然后它给监控的NameNode发送切换指令，让它由Standby状态切换为Active状态。存放edits文件的方式可以使用NFS—网络文件系统，另一种是JournalNode，DataNode连向的是NameService,DataNode既可以跟Active的NameNode通信又可以跟Standby的NameNode通信，一旦Active宕机，DataNode会自动向新的Active进行通信。

2：问题（JN的引出）

客户端如果同步写入主NN，备NN（写入主后继续写入备，直至写完才算写入成功），就会导致效率很慢！
客户端如果异步写入主NN，备NN（写入主后就返回写入成功，备NN进行后台同步主NN），就会存在备NN同步主NN时主NN挂了，导致备NN数据不全

解决办法（JournalNode）

CAP原则（一致性、可用性、分区容忍性三者之间的冲突）
Paxos算法
- 一种基于消息传递的一致性算法（被公认为类似算法中最有效的）
- 类似一种带存储能力的消息队列
- JournalNode（JN）就是一种实现
  - 明确分布式节点
  - 明确节点权重
  - 强一致性破坏可用性
  - 过半通过可以中和一致性和可用性
  - 最简单的自我协调实现：主从
  - 主的选举：明确节点数量和权重即可
  - 主从的职能
    - 主：增删改查
    - 从：查询，增删改传递给主
    - 主与从：过半数就要同步数据

3：主备NN

Active NN 和 Standby NN：两台 NN形成互备，一台处于 Active 状态，为主 NN，另外一台处于 Standby 状态，为备 NN，只有主 NN才能对外提供读写服务。
在HA模式中没有SecondaryNameNode（SNN），StandBy角色会滚动EditLog日志落向FSImage中，SNN只在非HA模式中

4：ZKFC

主备切换控制器 ZKFailoverController：ZKFC作为独立的进程运行（运行在NN所在主机上），对 NN的主备切换进行总体控制。
- 健康检测：zkfc会周期性的向它监控的namenode（只有namenode才有zkfc进程，并且每个namenode各一个）发生健康探测命令，从而鉴定某个namenode是否处于正常工作状态，如果机器宕机，心跳失败，那么zkfc就会标记它处于不健康的状态；
- 会话管理：如果namenode是健康的，zkfc机会保持在zookeeper中保持一个打开的会话，如果namenode是active状态的，那么zkfc还会在zookeeper中占有一个类型为短暂类型的znode，当这个namenode挂掉时，这个znode将会被删除，然后备用的namenode得到这把锁，升级为主的namenode，同时标记状态为active,当宕机的namenode,重新启动，他会再次注册zookeeper,发现已经有znode了，就自动变为standby状态，如此往复循环，保证高可靠性，但是Hadoop2.x仅支持最多配置两个namenode，Hadoop3.x支持多个
- master选举：如上所述，通过在zookeeper中维持一个短暂类型的znode,来实现抢占式的锁机制，从而判断哪个namenode为active状态。

5：zookeeper

Zookeeper 集群：为主备切换控制器提供主备选举支持。
- 目录树结构：/hadoop-ha/子目录下有锁，主备NN争抢
- 事件机制–》callBack（）回调函数，Watch监控着锁
- 有zkfc维持的临时节点

猜你喜欢

转载自blog.csdn.net/qq_37865420/article/details/106366033

HDFS的高可用（HA）图文并茂

HDFS HA 高可用

HDFS的HA高可用

HDFS HA高可用

HDFS HA 高可用集群搭建详细图文教程

HDFS高可用（HA)机制

HDFS-HA高可用

Hadoop HDFS高可用（HA）

HDFS的HA高可用资料

hdfs namenode HA高可用方案

HDFS High Availability 高可用(HA) with QJM

快速学习-HDFS HA高可用

vb教程图文并茂

图文并茂的PCA教程

图文并茂理解hashMap

Shell 数组（图文并茂）

mysql索引(图文并茂)

微软Bing突然爆炸级更新！无需等待人人可用，答案图文并茂

数字签名图文并茂

图文并茂详解Eclipse断点

redis 详细学习链接图文并茂

快速排序——JAVA实现（图文并茂）

图文并茂之AES加密

图文并茂解释什么是元模型

VLAN的简单配置实例（图文并茂）

图文并茂排序与算法总结

故事：走进JVM的世界（图文并茂）

(图文并茂) Linux 文件操作

Linux进程信号详解 -- 图文并茂！！！

磁盘结构分析图文并茂

今日推荐

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

“百模大战”必有一战 | 2024中国“百模大战”竞争格局分析

最强开源大模型 Llama 3 上架 Gitee AI

虽然老乡鸡开源的不是代码，但背后的原因却让人很暖心

富文本编辑器 Quill 2.0 重磅发布，特性、可靠性与开发者体验大幅提升

周排行

SVN同步出现问题

解决 nginx 出现 413 Request Entity Too Large 的问题

第一节区块链服务BaaS的总体架构以及基本模块设计的一种方案

ITeye 2013年度盘点——社区赠书书单

IDEA / git 和github 的新手使用教程史上最简单的 IntelliJ IDEA 教程史上最简单的 GitHub 教程

测试工程方法：测试用例设计综合策略

Spark优化(三)：对多次使用的RDD进行持久化

使用STM32 ST-LINK Utility 设置读保护后不能运行

exgcd 解同余方程ax=b(%n)

Android使用脚本进行多渠道打包

每日归档

更多

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)

2024-04-17(5)

2024-04-16(70)

2024-04-15(42)

2024-04-14(0)

2024-04-13(119)