上一篇，我们简单介绍了一下Hadoop的核心之一HDFS，对其中的一些概念有了一定的了解。今天我们来看看HDFS的一些原理解析。

二、原理解析

1、架构

这里写图片描述

HDFS是一个主/从（Mater/Slave）体系结构，从最终用户的角度来看，它就像传统的文件系统一样，可以通过目录路径对文件执行CRUD（Create、Read、Update和Delete）操作。但由于分布式存储的性质，HDFS集群拥有一个NameNode和一些DataNode。

NameNode管理文件系统的元数据，DataNode存储实际的数据。客户端通过同NameNode和DataNodes的交互访问文件系统。客户端联系NameNode以获取文件的元数据，而真正的文件I/O操作是直接和DataNode进行交互的。

2、管理员更新日志

这里写图片描述
- CheckPoint的时间点

fs.checkpoint.period 指定两次checkpoint的最大时间间隔，默认3600秒。

fs.checkpoint.size    规定edits文件的最大值，一旦超过这个值则强制checkpoint，不管是否到达最大时间间隔。默认大小是64M。

流程解析

1、每隔两个小时，或者edits文件超过最大值时，SecondaryNameNode通知NameNode切换edits，
此时在NameNode中生成一个名为edits.new的新edits，在fsimage被替换之前，所有的操作都会写到edits.new中。

2、SecondaryNameNode通过Http协议复制edits和fsimage到SecondaryNameNode中

3、SecondaryNameNode将fsimage导入内存，用edits中的操作，生成新的fsimage.ckpt文件

4、SecondaryNameNode将新的fsimage复制，并通过http Post传给NameNode

5、NameNode将接收到的新的fsimage.ckpt替换掉之前的fsimage,同时将新的edits.new重命名为edits，将之前的替换掉

3、读文件

这里写图片描述

初始化FileSystem，然后客户端(client)用FileSystem的open()函数打开文件

FileSystem用RPC调用元数据节点，得到文件的数据块信息，对于每一个数据块，元数据节点返回保存数据块的数据节点的地址。

FileSystem返回FSDataInputStream给客户端，用来读取数据，客户端调用stream的read()函数开始读取数据。

DFSInputStream连接保存此文件第一个数据块的最近的数据节点，data从数据节点读到客户端(client)

当此数据块读取完毕时，DFSInputStream关闭和此数据节点的连接，然后连接此文件下一个数据块的最近的数据节点。

当客户端读取完毕数据的时候，调用FSDataInputStream的close函数。
在读取数据的过程中，如果客户端在与数据节点通信出现错误，则尝试连接包含此数据块的下一个数据节点。

失败的数据节点将被记录，以后不再连接。

4、写文件

这里写图片描述

初始化FileSystem，客户端调用create()来创建文件

FileSystem用RPC调用元数据节点，在文件系统的命名空间中创建一个新的文件，元数据节点首先确定文件原来不存在，
并且客户端有创建文件的权限，然后创建新文件。

FileSystem返回DFSOutputStream，客户端用于写数据，客户端开始写入数据。

DFSOutputStream将数据分成块，写入data queue。data queue由Data Streamer读取，
并通知元数据节点分配数据节点，用来存储数据块(每块默认复制3块)。
分配的数据节点放在一个pipeline里。Data Streamer将数据块写入pipeline中的第一个数据节点。
第一个数据节点将数据块发送给第二个数据节点。第二个数据节点将数据发送给第三个数据节点。

DFSOutputStream为发出去的数据块保存了ack queue，等待pipeline中的数据节点告知数据已经写入成功。

当客户端结束写入数据，则调用stream的close函数。
此操作将所有的数据块写入pipeline中的数据节点，并等待ack queue返回成功。
最后通知元数据节点写入完毕。

如果数据节点在写入的过程中失败，关闭pipeline，将ack queue中的数据块放入data queue的开始，
当前的数据块在已经写入的数据节点中被元数据节点赋予新的标示，则错误节点重启后能够察觉其数据块是过时的，会被删除。
失败的数据节点从pipeline中移除，另外的数据块则写入pipeline中的另外两个数据节点。
元数据节点则被通知此数据块是复制块数不足，将来会再创建第三份备份。

总结：

今天我们接着上次介绍了一下HDFS的概念之后，我们对HDFS的架构，内部构造以及运行原理做了一些解析，下次我们将在实战中熟练使用HDFS做一些例子。

从零开始学Hadoop----浅析HDFS（二）

二、原理解析

1、架构

2、管理员更新日志

3、读文件

4、写文件

总结：

猜你喜欢