管理Hadoop集群—— Hadoop权威指南16

NameNode在内存中加载了文件系统元数据和block位置的映射关系
NameNode会永久性存储文件系统元数据，主要包括edits、fsimage、seen_txid
NameNode的目录结构如图所示
VERSION： Java属性文件，包含namespaceID（文件系首次格式化使创建）、block池ID、storageType（值为NAME_NODE）等
edits：
（1）编辑日志，对文件系统的操作（事务），先记录到edits文件中，同步更新内存的文件系统元数据
（2）inprogress表示这个正在写入的edits文件，其后缀为起始事务id
（3）只带事务id的edits文件，表示存储的事务范围
fsimage： 文件系统元数据映像，是文件系统元数据的一个完整的永久性检查点
（1）NameNode发生故障，将磁盘中的fsimage重新加载到内存，以重构元数据的最近状态；再执行edits文件的中的事务，从而恢复最新状态
（2） fsimage存储了文件系统的所有目录和inode信息：对文件来说，包括副本数、修改时间、访问时间、访问许可、block size等；对目录来说：修改时间、访问许可、配置元数据等
-seen_txid： 记录edits中的事务id尾数，故障重启时，会重新执行事务00001 ~ seen_txid

NameNode不负责永久存储block位置映射

fsimage的创建过程

检查点的创建时机

DataNode的目录结构如图所示
blk开头的文件： 数据块或数据块的元数据，meta结尾的表示未block的元数据，包含：头部、block的校验和等信息
BP开头目录名： block池ID作为目录名，如果一个目录中的block超过64个，则创建新的目录
dfs.datanode.dir属性，配置了多个目录，则block会以round-robin的方式写入这些目录中；同时，整个DataNode上的block不会重复

Hadoop启动NameNode时，NameNode处于安全模式

fsck工具，检查HDFS中block的健康情况

度量和计数器的区别

计数器由任务进行采集，面向用户；metric由守护进程采集，面向admin
计数器由任务的jvm产生，任务和Application master都会进行汇总；metric独立于接收更新的组件，可以通过jmx输出，由守护进程收集、汇总

include文件

允许连接到NameNode的DataNode由dfs.hosts属性指定，允许连接到ResourceManager的NodeManager由yarn.resourcemanager.nodes.include-path属性指定
这两个属性都存在于include文件中

include文件不同于slaves文件：

exclude文件：

不允许连接到NameNode的DataNode节点，由dfs.hosts.exclue属性指定；不允许连接到ResourceManager的NodeManager由yarn.resourcemanager.nodes.exnclude-path属性指定
NodeManager节点是否可以连接ResourceManager的判断非常简单：出现在include文件中，未出现在exclude文件中
DataNode节点是否可以连接NameNode的判断则相对复杂：

节点添加的过程

节点移除的过程
在这里插入图片描述

NameNode的内存和磁盘会存储了哪些信息？

辅助NameNode如何创建fsimage（永久性检查点）？

NameNode的安全模式

fsck工具：

节点的添加和移除