HDFS以及HBase动态增加和删除节点

然后来看一下关于节点的动态增加与动态删除问题

1、hdfs增加datanode
1> 准备新节点的操作系统，安装好需要的软件，实现ssh无密码登录
2> 各个节点的配置文件需要更改
$HBASE_HOME/conf/regionservers
$HADOOP_HOME/etc/hadoop/slaves
/etc/hosts
3> 在新节点执行以下命令

hadoop-daemon.sh start datanode
yarn-daemon.sh start nodemanager

4> 刷新一下

yarn rmadmin -refreshNodes
hdfs dfsadmin -refreshNodes
# 查看状态
hdfs dfsadmin -report

5> 设置带宽，配置均衡器balancer，一般不在主节点上运行，以避免影响业务，可以有专门的balancer节点

hdfs dfsadmin -setBalancerBandwidth 1048576
# 如果某个datanode的磁盘里用率比平均水平高出5%，Blocks向其他低于平均水平的datanode中传送
start-balancer.sh -threshold 5

说明：
随时时间推移，各个datanode上的块分布来越来越不均衡，这将降低MR的本地性，导致部分datanode相对更加繁忙。
balancer是一个hadoop守护进程，它将块从忙碌的datanode移动相对空闲的datanode，同时坚持块复本放置策略，将复本分散到不同的机器、机架。
balancer会促使每个datanode的使用率与整个集群的使用率接近，这个“接近”是通过-threashold参数指定的，默认是10%。
不同节点之间复制数据的带宽是受限的，默认是1MB/s，可以通过hdfs-site.xml文件中的dfs.balance.bandwithPerSec属性指定（单位是字节）。
建议定期执行均衡器，如每天或者每周。

2、hdfs删除datanode

1> $HADOOP_HOME/etc/hadoop/excludes文件中添加需删除的主机名，一般在执行命令的主节点上添加即可
2> 刷新一下

yarn rmadmin -refreshNodes
hdfs dfsadmin -refreshNodes

3> 删除后修正以下配置文件，
$HBASE_HOME/conf/regionservers
$HADOOP_HOME/etc/hadoop/slaves
/etc/hosts

注意：关于hadoop集群删除数据节点一直处于Decommission in progress状态问题
在小集群中（例如3台机器），如果datanode数据量小于文件的备份数设置（默认是3），有可能会出现这样的情况，被数据节点一直处于Decommission in progress状态。
这个是hadoop的一个未处理的问题，因为大的集群一般不会出现这种情况，即datanode数据量小于文件的备份数设置
解决方案是：尝试将文件备份数设置为1或者2，然后尝试从三台datanode中exclude掉一台
以下是修改已有的副本数量的命令，一般不建议使用，而应提前在配置文件中进行优化，以避免出现此类问题
hdfs dfs -setrep -w 2 -R /文件

3、hbase增加regionserver节点

1> 执行以下命令启动regionserver

hbase-daemon.sh start regionserver

2> 在新启动的节点上
打开hbase shell，如下设置：

balance_switch true

4、hbase删除regionserver节点

1> 执行命令

graceful_stop.sh data1

2> 由于会关闭hbase的balancer，因此需要在其他regionserver节点上

打开hbase shell，检查hbase状态
同时重新设置：

 balance_switch true

此外，注意执行的顺序，如果一个datanodet同时作为regionserver,先删除regionserver，再删除datanode，反之，新增的节点，先设为datanode，再设为regionserver

HDFS以及HBase动态增加和删除节点

猜你喜欢