Hadoop的NameNode和SecondaryNameNode的功能描述 - 代码天地

Hadoop的NameNode和SecondaryNameNode的功能描述

其他 2018-12-08 12:20:48 阅读次数: 0

弄明白了云计算和大数据以及hadoop的概念，思想交给哲学家，我们来研究一下技术实现

hadoop这个家伙是怎么个构造？怎么实现的大数据存储？怎么实现的大数据计算？

首先我们来看构造NameNode和SecondaryNameNode，这俩是hadoop的管理者，

我们来主要研究下这俩小兄弟都做了什么工作？

举例说明：现在我要使用hadoop存储一个640M的数据，hadoop会将这个数据进行拆分，拆分成10份，每一份64M（当然这个64不是固定的可以通过配置文件进行更改）

然后将这10份数（我们起名字D1-D10）据存储到DataNode上。

假设有DataNode1存储了D1，DataNode2存储了D1，D1，D2（为什么出来两个D1两个D2 这是HDFS的特点，数据备份，防止DataNode1损坏数据丢失）DataNode3存储了D2，D2，D3.

那么以上这些信息都会被存储到NameNode中。NameNode怎么知道哪一个DataNode保存了哪一些block？是DataNode启动的时候向NameNode汇报的。

这个地方要说一些NameNode与DataNode的关系，他们是一种主从结构的关系，他们之间是通过心跳建立链接互通数据的。一旦心跳链接断开（一方得不到另一方发来的信息，一般是指NameNode得不到DataNode发来的信息），表示DataNode死亡。每一次心跳DataNode都会把我这个数据节点新增的block，待移除的block，无效的block，损坏的block，正在处理的block等信息传递到NameNode并得到NameNode的一个反馈完成此次心跳链接。

那么NameNode拿到这些信息后，存储到哪里呢？这里就要说到NameNode的两个重要文件

fsimage元数据镜像文件（说白了就是备份）

edits 元数据操作文件（说白了就是日志）

我们都知道备份是有实践点的，而日志会记录下系统当前最新的操作。所以有了备份和日志，实际上你就可以确保数据在损坏时最新的状态。这个时候你可能会说,那是不是要定时的去把备份更新一下啊，不然日志文件越来越大，备份的数据也会越来越古老。对的！！！应该是有这个操作，而且这个操作必须是个任务，每隔一定的时间就将日志中的变更同步到备份中。

那谁来做这个操作呢？你或许会说肯定是NameNode啊，这俩文件都在这上面！！！但是不是的，因为NameNode的主要工作还是对DataNode的管理，或者说给用户提供操作数据访问数据的服务！哪还有闲工夫管备份，忙都忙死了...

这个时候，SecondaryNameNode就出现了，这个小伙子就是帮助NameNode根据日志同步备份的。

也就是说SecondaryNameNode会定时的根据edits文件更新fsimage文件。也正是由于这份工作的特殊性，一旦NameNode死磕了，SecondaryNameNode会立马变身成为NameNode，保证系统正常运行。

就说这么多，没什么概念，就是描述一下自己的理解。实际上软件开发很难用概念去描述。网上技术博客很多，写的也比这详细的多，关键是理解，希望我上面的描述对你形成自己的理解有一定的帮助。我暂时就理解到这个程度。

猜你喜欢

转载自blog.csdn.net/wjyyawjx/article/details/84875782

Hadoop的NameNode和SecondaryNameNode的功能描述

hadoop SecondaryNameNode和NameNode

Hadoop：NameNode和SecondaryNameNode

Hadoop基础-NameNode和SecondaryNameNode工作机制

hadoop NameNode和SecondaryNameNode 工作机制

hadoop的NameNode和SecondaryNameNode、DataNode的工作机制

Hadoop 之 HDFS (NameNode 和 SecondaryNameNode)

NameNode和SecondaryNameNode

NameNode 和 SecondaryNameNode

(转)hadoop 从secondarynamenode 恢复namenode

hadoop 根据SecondaryNameNode恢复Namenode

hadoop集群管理之 SecondaryNameNode和NameNode(转)

大数据-Hadoop生态(9)-NameNode和SecondaryNameNode

Hadoop之HDFS(NameNode和SecondaryNameNode)（面试开发重点）

hdfs的namenode、datanode和secondarynamenode

NameNode和SecondaryNameNode工作机制

快速学习-NameNode和SecondaryNameNode

NameNode 和 SecondaryNamenode 的工作机制

NameNode和SecondaryNameNode（了解五）

NameNode和SecondaryNameNode（重点四）

NameNode和SecondaryNameNode（重点三）

NameNode和SecondaryNameNode（重点二）

NameNode和SecondaryNameNode（重点一）

（转）hadoop 根据SecondaryNameNode恢复Namenode

Hadoop学习之SecondaryNameNode、NameNode恢复

Hadoop分别启动namenode,datanode,secondarynamenode等服务

NameNode 与 SecondaryNameNode

hadoop namenode热备切换过程和secondarynamenode的作用

大数据技术之Hadoop（HDFS）第5章 NameNode和SecondaryNameNode

HDFS 之 NameNode 和 SecondaryNameNode 关系解析

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)