前言

随着公司业务的增长，数据量越来越大，原有的数据节点的容量已经不能满足存储数据的需求，需要在原有集群基础上动态添加新的数据节点。

动态新增节点

环境准备
（1）在hadoop104主机上再克隆一台hadoop105主机
（2）修改IP地址和主机名称
（3）删除原来HDFS文件系统留存的文件（/opt/module/hadoop-2.7.2/data和log）
（4）source一下配置文件

[zhengkw@hadoop105 hadoop-2.7.2]$ source /etc/profile

服役新节点具体步骤
（1）直接启动DataNode，即可关联到集群

[zhengkw@hadoop105 hadoop-2.7.2]$ sbin/hadoop-daemon.sh start datanode
[zhengkw@hadoop105 hadoop-2.7.2]$ sbin/yarn-daemon.sh start nodemanager

（2）测试！！在hadoop105上上传文件

[zhengkw@hadoop105 hadoop-2.7.2]$ hadoop fs -put /opt/module/hadoop-2.7.2/LICENSE.txt /

（3）如果数据不均衡，可以用命令实现集群的再平衡

[zhengkw@hadoop102 sbin]$ ./start-balancer.sh

starting balancer, logging to 
/opt/module/hadoop-2.7.2/logs/hadoop-zhengkw-balancer-hadoop102.out  	
Time Stamp      I
teration# 
 Bytes Already Moved  Bytes 
 Left To Move  Bytes Being Moved

在这里插入图片描述

白名单退役

添加白名单
添加到白名单的主机节点，都允许访问NameNode，不在白名单的主机节点，都会被退出。
配置白名单的具体步骤如下：
（1）在NameNode的/opt/module/hadoop-2.7.2/etc/hadoop目录下创建dfs.hosts文件

[zhengkw@hadoop102 hadoop]$ pwd
/opt/module/hadoop-2.7.2/etc/hadoop
[zhengkw@hadoop102 hadoop]$ touch dfs.hosts
[zhengkw@hadoop102 hadoop]$ vim dfs.hosts

添加如下主机名称（不添加hadoop105）注意每行不能空格，最后不能空行！！

hadoop102
hadoop103
hadoop104

（2）在NameNode的hdfs-site.xml配置文件中增加dfs.hosts属性

<property>
	<name>dfs.hosts</name>
	<value>/opt/module/hadoop-2.7.2/etc/hadoop/dfs.hosts</value>
</property>

（3）配置文件分发

[zhengkw@hadoop102 hadoop]$ xsync hdfs-site.xml

（4）刷新NameNode

[zhengkw@hadoop102 hadoop-2.7.2]$ hdfs dfsadmin -refreshNodes

Refresh nodes successful

（5）更新ResourceManager节点

[zhengkw@hadoop102 hadoop-2.7.2]$ yarn rmadmin -refreshNodes

20/02/12 14:17:11 INFO client.RMProxy: Connecting to ResourceManager
at hadoop103/192.168.58.103:8033

（6）在web浏览器上查看
在这里插入图片描述

如果数据不均衡，可以用命令实现集群的再平衡

[zhengkw@hadoop102 sbin]$ ./start-balancer.sh

starting balancer, logging to
/opt/module/hadoop-2.7.2/logs/hadoop-zhengkw-balancer-hadoop102.out
Time Stamp Iteration# Bytes Already Moved Bytes Left
To Move Bytes Being Moved

黑名单退役

在黑名单上面的主机都会被强制退出。
1.在NameNode的/opt/module/hadoop-2.7.2/etc/hadoop目录下创建dfs.hosts.exclude文件

[zhengkw@hadoop102 hadoop]$ pwd

/opt/module/hadoop-2.7.2/etc/hadoop

[zhengkw@hadoop102 hadoop]$ touch dfs.hosts.exclude
[zhengkw@hadoop102 hadoop]$ vim dfs.hosts.exclude

添加如下主机名称（要退役的节点）不空行，尾部不空格！！

hadoop105

2．在NameNode的hdfs-site.xml配置文件中增加dfs.hosts.exclude属性

<property>
	<name>dfs.hosts.exclude</name>
	<value>/opt/module/hadoop-2.7.2/etc/hadoop/dfs.hosts.exclude</value>
</property>

3．刷新NameNode、刷新ResourceManager

[zhengkw@hadoop102 hadoop-2.7.2]$ hdfs dfsadmin -refreshNodes

Refresh nodes successful

[zhengkw@hadoop102 hadoop-2.7.2]$ yarn rmadmin -refreshNodes

17/06/24 14:55:56 INFO client.RMProxy: Connecting to ResourceManager
at hadoop103/192.168.1.103:8033

检查Web浏览器，退役节点的状态为decommission in progress（退役中），说明数据节点正在复制块到其他节点。

在这里插入图片描述

等待退役节点状态为decommissioned（所有块已经复制完成），停止该节点及节点资源管理器。注意：如果副本数是3，服役的节点小于等于3，是不能退役成功的，需要修改副本数后才能退役。

[zhengkw@hadoop105 hadoop-2.7.2]$ sbin/hadoop-daemon.sh stop datanode

stopping datanode

[zhengkw@hadoop105 hadoop-2.7.2]$ sbin/yarn-daemon.sh stop nodemanager

stopping nodemanager

如果数据不均衡，可以用命令实现集群的再平衡

[zhengkw@hadoop102 hadoop-2.7.2]$ sbin/start-balancer.sh

starting balancer, logging to
/opt/module/hadoop-2.7.2/logs/hadoop-zhengkw-balancer-hadoop102.out
Time Stamp Iteration# Bytes Already Moved Bytes Left
To Move Bytes Being Moved

注意：不允许白名单和黑名单中同时出现同一个主机名称。一同出现的结果是，这个主机会被黑名单排除掉！相当于直接退役掉！！没法启动！

有个写的比较详细推荐

小总结

新增节点只需要将克隆好的机器，删除掉原有的data，logs数据即可单点启动datanode！！
退役节点一定检查副本数！否则会导致无法退役成功，详情见黑名单退役5小节！
一般白名单用在刚搭建集群的时候使用！黑名单用于正常的退役服务器

多目录

DataNode也可以配置成多个目录，每个目录存储的数据不一样。即：数据不是副本
2．具体配置如下

修改hdfs-site.xml

<property>
        <name>dfs.datanode.data.dir</name>
	<value>file:///${hadoop.tmp.dir}/dfs/data1,file:///${hadoop.tmp.dir}/dfs/data2</value>
</property>

总结

多目录需要修改hdfs-site.xml
file:///${hadoop.tmp.dir}/dfs/data2
${hadoop.tmp.dir}要和core-site中的hadoop.tmp.dir对应！
新增节点往往用于增加集群临时的负载能力，可以有效的应对用户访问量递增的情况！
合理使用黑白名单，更有效的管理集群访问！

R.I.PKobe

发布了37 篇原创文章 · 获赞 17 · 访问量 1820

私信关注

Hadoop节点动态新增和退役&Datanode多目录

前言

动态新增节点

白名单退役

黑名单退役

小总结

多目录

修改hdfs-site.xml

总结

猜你喜欢