【转】Hadoop集群的NameNode的备份 - 代码天地

【转】Hadoop集群的NameNode的备份

企业开发 2018-05-14 16:55:55 阅读次数: 3

原文链接：http://www.tech126.com/tag/secondary-namenode/

Hadoop集群中，NameNode节点存储着HDFS上所有文件和目录的元数据信息

如果NameNode挂了，也就意味着整个Hadoop集群也就完了

所以，NameNode节点的备份很重要，可以从以下2个方面来备份NameNode节点

1. 在hdfs-site.xml中，配置多个name的dir到不同的磁盘分区上：

<property>
<name>dfs.name.dir</name>
<value>/pvdata/hadoopdata/name/,/opt/hadoopdata/name/</value>
</property>

2. 在另外的一台服务器上配置Secondary NameNode：它是NameNode的一个备份

Secondary NameNode会定期合并fsimage和edits日志，将edits日志文件大小控制在一个限度下

合并的时机是由2个配置参数决定的：

fs.checkpoint.period，指定连续两次检查点的最大时间间隔，默认值是1小时。
fs.checkpoint.size定义了edits日志文件的最大值，一旦超过这个值会导致强制执行检查点（即使没到检查点的最大时间间隔）。默认值是64MB。

Secondary NameNode的配置过程如下：

在conf/masters中指定第二名称节点的主机名

在core-site.xml中指定checkpoint的目录

<property>
<name>fs.checkpoint.dir</name>
<value>/opt/hadoopdata/secondname,/pvdata/hadoopdata/secondname</value>
<description>Determines where on the local filesystem the DFS secondary
      name node should store the temporary images to merge.
      If this is a comma-delimited list of directories then the image is
      replicated in all of the directories for redundancy.
</description>
</property>

如果NameNode节点挂了，可以按照如下步骤来从Secondary NameNode来恢复：

在 dfs.name.dir 指定的位置建立一个空文件夹
从 Secondary NameNode上把 secondname的目录给scp到新的NameNode机器的fs.checkpoint.dir下
使用hadoop/bin/hadoop namenode -importCheckpoint 来启动NameNode，主要不要执行format命令
使用hadoop fsck /user命令检查文件Block的完整性

详细的 Secondary NameNode细节可参考Hadoop官方文档：

http://hadoop.apache.org/common/docs/r0.20.2/hdfs_user_guide.html#Secondary+NameNode

猜你喜欢

转载自damacheng009.iteye.com/blog/1581164

【转】Hadoop集群的NameNode的备份

Hadoop集群的NameNode的备份

hadoop集群管理之 SecondaryNameNode和NameNode(转)

hadoop集群namenode无法启动

hadoop集群的namenode无法启动

(转)hadoop 从secondarynamenode 恢复namenode

(转)hadoop主节点（NameNode）备份策略以及恢复方法

hadoop集群无法启动namenode： ERROR namenode.NameNode: Failed to start namenode.

hadoop集群的高可用（Namenode&&ResourceManager）

Hadoop集群的Namenode HA高可用配置

大规模集群下的Hadoop NameNode

（转）hadoop 根据SecondaryNameNode恢复Namenode

hadoop主节点（NameNode）备份策略以及恢复方法

hadoop NameNode

【转】hadoop集群部署

hadoop集群 secondary namenode 的作用，fsiamge和edit的关系

Hadoop 启动集群时 NameNode 和 DataNode 不能同时启动

hadoop HA 集群namenode无法自动切换为active

阿里云Hadoop集群DataNode连接不上NameNode

hadoop错误--集群启动master时namenode进程无法启动

Hadoop HA集群两个NameNode都是standby或者主NameNode是standby，从NameNode是active的情况集锦

Hadoop NameNode 高可用 (High Availability) 实现解析[转]

Hadoop——namenode&secondary namenode

Hadoop集群默认配置（转）

【转】Hadoop集群配置详解

（转）hadoop 集群常用端口

Hadoop ha CDH5.15.1-hadoop集群启动后，两个namenode都是standby模式

hadoop namenode的功能

hadoop namenode safe mode

hadoop namenode报错

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

NEFU 117 素数个数的位数

Closest Common Ancestors (Lca,tarjan)

ELK部署

【转载】Hive笔记整理（三）

SQL语句（一）基本表的定义

关于Java web开发中的MySQL的事务语句

MFC创建自定义窗体

如何用一句话激怒程序员？

《逆袭大学》文摘——9.4 基础和应用的平衡中找到大学的节奏

【spring源码分析】@Value注解原理

每日归档

更多

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)