Hadoop节点动态新增和退役&Datanode多目录

前言

随着公司业务的增长,数据量越来越大,原有的数据节点的容量已经不能满足存储数据的需求,需要在原有集群基础上动态添加新的数据节点。

动态新增节点

  1. 环境准备
    (1)在hadoop104主机上再克隆一台hadoop105主机
    (2)修改IP地址和主机名称
    (3)删除原来HDFS文件系统留存的文件(/opt/module/hadoop-2.7.2/data和log)
    (4)source一下配置文件
[zhengkw@hadoop105 hadoop-2.7.2]$ source /etc/profile
  1. 服役新节点具体步骤
    (1)直接启动DataNode,即可关联到集群
[zhengkw@hadoop105 hadoop-2.7.2]$ sbin/hadoop-daemon.sh start datanode
[zhengkw@hadoop105 hadoop-2.7.2]$ sbin/yarn-daemon.sh start nodemanager

(2)测试!!在hadoop105上上传文件

[zhengkw@hadoop105 hadoop-2.7.2]$ hadoop fs -put /opt/module/hadoop-2.7.2/LICENSE.txt /

(3)如果数据不均衡,可以用命令实现集群的再平衡

[zhengkw@hadoop102 sbin]$ ./start-balancer.sh
starting balancer, logging to 
/opt/module/hadoop-2.7.2/logs/hadoop-zhengkw-balancer-hadoop102.out  	
Time Stamp      I
teration# 
 Bytes Already Moved  Bytes 
 Left To Move  Bytes Being Moved

在这里插入图片描述

白名单退役

添加白名单
添加到白名单的主机节点,都允许访问NameNode,不在白名单的主机节点,都会被退出。
配置白名单的具体步骤如下:
(1)在NameNode的/opt/module/hadoop-2.7.2/etc/hadoop目录下创建dfs.hosts文件

[zhengkw@hadoop102 hadoop]$ pwd
/opt/module/hadoop-2.7.2/etc/hadoop
[zhengkw@hadoop102 hadoop]$ touch dfs.hosts
[zhengkw@hadoop102 hadoop]$ vim dfs.hosts

添加如下主机名称(不添加hadoop105)注意每行不能空格,最后不能空行!!

hadoop102
hadoop103
hadoop104
(2)在NameNode的hdfs-site.xml配置文件中增加dfs.hosts属性
<property>
	<name>dfs.hosts</name>
	<value>/opt/module/hadoop-2.7.2/etc/hadoop/dfs.hosts</value>
</property>

(3)配置文件分发

[zhengkw@hadoop102 hadoop]$ xsync hdfs-site.xml

(4)刷新NameNode

[zhengkw@hadoop102 hadoop-2.7.2]$ hdfs dfsadmin -refreshNodes

Refresh nodes successful

(5)更新ResourceManager节点

[zhengkw@hadoop102 hadoop-2.7.2]$ yarn rmadmin -refreshNodes

20/02/12 14:17:11 INFO client.RMProxy: Connecting to ResourceManager
at hadoop103/192.168.58.103:8033

(6)在web浏览器上查看
在这里插入图片描述

  1. 如果数据不均衡,可以用命令实现集群的再平衡
[zhengkw@hadoop102 sbin]$ ./start-balancer.sh

starting balancer, logging to
/opt/module/hadoop-2.7.2/logs/hadoop-zhengkw-balancer-hadoop102.out
Time Stamp Iteration# Bytes Already Moved Bytes Left
To Move Bytes Being Moved

黑名单退役

在黑名单上面的主机都会被强制退出。
1.在NameNode的/opt/module/hadoop-2.7.2/etc/hadoop目录下创建dfs.hosts.exclude文件

[zhengkw@hadoop102 hadoop]$ pwd

/opt/module/hadoop-2.7.2/etc/hadoop

[zhengkw@hadoop102 hadoop]$ touch dfs.hosts.exclude
[zhengkw@hadoop102 hadoop]$ vim dfs.hosts.exclude

添加如下主机名称(要退役的节点)不空行,尾部不空格!!

hadoop105

2.在NameNode的hdfs-site.xml配置文件中增加dfs.hosts.exclude属性

<property>
	<name>dfs.hosts.exclude</name>
	<value>/opt/module/hadoop-2.7.2/etc/hadoop/dfs.hosts.exclude</value>
</property>

3.刷新NameNode、刷新ResourceManager

[zhengkw@hadoop102 hadoop-2.7.2]$ hdfs dfsadmin -refreshNodes

Refresh nodes successful

[zhengkw@hadoop102 hadoop-2.7.2]$ yarn rmadmin -refreshNodes

17/06/24 14:55:56 INFO client.RMProxy: Connecting to ResourceManager
at hadoop103/192.168.1.103:8033

  1. 检查Web浏览器,退役节点的状态为decommission in progress(退役中),说明数据节点正在复制块到其他节点。

在这里插入图片描述

  1. 等待退役节点状态为decommissioned(所有块已经复制完成),停止该节点及节点资源管理器。注意:如果副本数是3,服役的节点小于等于3,是不能退役成功的,需要修改副本数后才能退役
    在这里插入图片描述
[zhengkw@hadoop105 hadoop-2.7.2]$ sbin/hadoop-daemon.sh stop datanode

stopping datanode

[zhengkw@hadoop105 hadoop-2.7.2]$ sbin/yarn-daemon.sh stop nodemanager

stopping nodemanager

  1. 如果数据不均衡,可以用命令实现集群的再平衡
[zhengkw@hadoop102 hadoop-2.7.2]$ sbin/start-balancer.sh 

starting balancer, logging to
/opt/module/hadoop-2.7.2/logs/hadoop-zhengkw-balancer-hadoop102.out
Time Stamp Iteration# Bytes Already Moved Bytes Left
To Move Bytes Being Moved

注意:不允许白名单和黑名单中同时出现同一个主机名称。一同出现的结果是,这个主机会被黑名单排除掉!相当于直接退役掉!!没法启动!

有个写的比较详细推荐

小总结

新增节点只需要将克隆好的机器,删除掉原有的data,logs数据即可单点启动datanode!!
退役节点一定检查副本数!否则会导致无法退役成功,详情见黑名单退役5小节!
一般白名单用在刚搭建集群的时候使用!黑名单用于正常的退役服务器

多目录

  1. DataNode也可以配置成多个目录,每个目录存储的数据不一样。即:数据不是副本
    2.具体配置如下

修改hdfs-site.xml

<property>
        <name>dfs.datanode.data.dir</name>
	<value>file:///${hadoop.tmp.dir}/dfs/data1,file:///${hadoop.tmp.dir}/dfs/data2</value>
</property>

总结

  • 多目录需要修改hdfs-site.xml
    file:///${hadoop.tmp.dir}/dfs/data2
    ${hadoop.tmp.dir}要和core-site中的hadoop.tmp.dir对应!
  • 新增节点往往用于增加集群临时的负载能力,可以有效的应对用户访问量递增的情况!
  • 合理使用黑白名单,更有效的管理集群访问!
发布了37 篇原创文章 · 获赞 17 · 访问量 1820

猜你喜欢

转载自blog.csdn.net/qq_37714755/article/details/104886251
今日推荐