前言
随着公司业务的增长,数据量越来越大,原有的数据节点的容量已经不能满足存储数据的需求,需要在原有集群基础上动态添加新的数据节点。
动态新增节点
- 环境准备
(1)在hadoop104主机上再克隆一台hadoop105主机
(2)修改IP地址和主机名称
(3)删除原来HDFS文件系统留存的文件(/opt/module/hadoop-2.7.2/data和log)
(4)source一下配置文件
[zhengkw@hadoop105 hadoop-2.7.2]$ source /etc/profile
- 服役新节点具体步骤
(1)直接启动DataNode,即可关联到集群
[zhengkw@hadoop105 hadoop-2.7.2]$ sbin/hadoop-daemon.sh start datanode
[zhengkw@hadoop105 hadoop-2.7.2]$ sbin/yarn-daemon.sh start nodemanager
(2)测试!!在hadoop105上上传文件
[zhengkw@hadoop105 hadoop-2.7.2]$ hadoop fs -put /opt/module/hadoop-2.7.2/LICENSE.txt /
(3)如果数据不均衡,可以用命令实现集群的再平衡
[zhengkw@hadoop102 sbin]$ ./start-balancer.sh
starting balancer, logging to
/opt/module/hadoop-2.7.2/logs/hadoop-zhengkw-balancer-hadoop102.out
Time Stamp I
teration#
Bytes Already Moved Bytes
Left To Move Bytes Being Moved
白名单退役
添加白名单
添加到白名单的主机节点,都允许访问NameNode,不在白名单的主机节点,都会被退出。
配置白名单的具体步骤如下:
(1)在NameNode的/opt/module/hadoop-2.7.2/etc/hadoop目录下创建dfs.hosts文件
[zhengkw@hadoop102 hadoop]$ pwd
/opt/module/hadoop-2.7.2/etc/hadoop
[zhengkw@hadoop102 hadoop]$ touch dfs.hosts
[zhengkw@hadoop102 hadoop]$ vim dfs.hosts
添加如下主机名称(不添加hadoop105)注意每行不能空格,最后不能空行!!
hadoop102
hadoop103
hadoop104
(2)在NameNode的hdfs-site.xml配置文件中增加dfs.hosts属性
<property>
<name>dfs.hosts</name>
<value>/opt/module/hadoop-2.7.2/etc/hadoop/dfs.hosts</value>
</property>
(3)配置文件分发
[zhengkw@hadoop102 hadoop]$ xsync hdfs-site.xml
(4)刷新NameNode
[zhengkw@hadoop102 hadoop-2.7.2]$ hdfs dfsadmin -refreshNodes
Refresh nodes successful
(5)更新ResourceManager节点
[zhengkw@hadoop102 hadoop-2.7.2]$ yarn rmadmin -refreshNodes
20/02/12 14:17:11 INFO client.RMProxy: Connecting to ResourceManager
at hadoop103/192.168.58.103:8033
(6)在web浏览器上查看
- 如果数据不均衡,可以用命令实现集群的再平衡
[zhengkw@hadoop102 sbin]$ ./start-balancer.sh
starting balancer, logging to
/opt/module/hadoop-2.7.2/logs/hadoop-zhengkw-balancer-hadoop102.out
Time Stamp Iteration# Bytes Already Moved Bytes Left
To Move Bytes Being Moved
黑名单退役
在黑名单上面的主机都会被强制退出。
1.在NameNode的/opt/module/hadoop-2.7.2/etc/hadoop目录下创建dfs.hosts.exclude文件
[zhengkw@hadoop102 hadoop]$ pwd
/opt/module/hadoop-2.7.2/etc/hadoop
[zhengkw@hadoop102 hadoop]$ touch dfs.hosts.exclude
[zhengkw@hadoop102 hadoop]$ vim dfs.hosts.exclude
添加如下主机名称(要退役的节点)不空行,尾部不空格!!
hadoop105
2.在NameNode的hdfs-site.xml配置文件中增加dfs.hosts.exclude属性
<property>
<name>dfs.hosts.exclude</name>
<value>/opt/module/hadoop-2.7.2/etc/hadoop/dfs.hosts.exclude</value>
</property>
3.刷新NameNode、刷新ResourceManager
[zhengkw@hadoop102 hadoop-2.7.2]$ hdfs dfsadmin -refreshNodes
Refresh nodes successful
[zhengkw@hadoop102 hadoop-2.7.2]$ yarn rmadmin -refreshNodes
17/06/24 14:55:56 INFO client.RMProxy: Connecting to ResourceManager
at hadoop103/192.168.1.103:8033
- 检查Web浏览器,退役节点的状态为decommission in progress(退役中),说明数据节点正在复制块到其他节点。
- 等待退役节点状态为decommissioned(所有块已经复制完成),停止该节点及节点资源管理器。注意:如果副本数是3,服役的节点小于等于3,是不能退役成功的,需要修改副本数后才能退役。
[zhengkw@hadoop105 hadoop-2.7.2]$ sbin/hadoop-daemon.sh stop datanode
stopping datanode
[zhengkw@hadoop105 hadoop-2.7.2]$ sbin/yarn-daemon.sh stop nodemanager
stopping nodemanager
- 如果数据不均衡,可以用命令实现集群的再平衡
[zhengkw@hadoop102 hadoop-2.7.2]$ sbin/start-balancer.sh
starting balancer, logging to
/opt/module/hadoop-2.7.2/logs/hadoop-zhengkw-balancer-hadoop102.out
Time Stamp Iteration# Bytes Already Moved Bytes Left
To Move Bytes Being Moved
注意:不允许白名单和黑名单中同时出现同一个主机名称。一同出现的结果是,这个主机会被黑名单排除掉!相当于直接退役掉!!没法启动!
小总结
新增节点只需要将克隆好的机器,删除掉原有的data,logs数据即可单点启动datanode!!
退役节点一定检查副本数!否则会导致无法退役成功,详情见黑名单退役5小节!
一般白名单用在刚搭建集群的时候使用!黑名单用于正常的退役服务器
多目录
- DataNode也可以配置成多个目录,每个目录存储的数据不一样。即:数据不是副本
2.具体配置如下
修改hdfs-site.xml
<property>
<name>dfs.datanode.data.dir</name>
<value>file:///${hadoop.tmp.dir}/dfs/data1,file:///${hadoop.tmp.dir}/dfs/data2</value>
</property>
总结
- 多目录需要修改hdfs-site.xml
file:///${hadoop.tmp.dir}/dfs/data2
${hadoop.tmp.dir}要和core-site中的hadoop.tmp.dir对应! - 新增节点往往用于增加集群临时的负载能力,可以有效的应对用户访问量递增的情况!
- 合理使用黑白名单,更有效的管理集群访问!