Hadoop2.7.5高可用zookeeper搭建

集群规划

hadoop HA集群的搭建依赖zookeeper，所以选取三台当作zookeeper集群，这次准备了4台主机，分别是hadoopm,hadoopsm,slave1,slave2,其中hadoopm和hadoopsm做namenode的主备切换，slave1，slave2做resourcemanager的主备切换

集群规划
	hadoop'm	hadoop's'm	slave1	slave2
namenode	√	√
datanode	√	√	√	√
resourcemanager			√	√
nodemanager	√	√	√	√
zookeeper	√	√	√
journalnode	√	√	√
zkfc	√	√

1.下载 hadoop-2.7.5.tar.gz 安装包

2.通过CRT软件上传到hadoopm号机器

3.解压软件到目录下/usr/local

tar -zxvf hadoop-2.7.5-centos-6.7.tar.gz -C /usr/local

4.修改hadoop-env.sh 配置文件

先查看jdk安装路径

echo $JAVA_HOME

vim hadoop-env.sh 修改为：

5.修改core-site.xml 配置文件

<?xml version="1.0" encoding="UTF-8"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<!--
Licensed under the Apache License, Version 2.0 (the "License");
you may not use this file except in compliance with the License.
You may obtain a copy of the License at

http://www.apache.org/licenses/LICENSE-2.0

Unless required by applicable law or agreed to in writing, software
distributed under the License is distributed on an "AS IS" BASIS,
WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
See the License for the specific language governing permissions and
limitations under the License. See accompanying LICENSE file.
-->

<configuration>
<property>
<name>fs.defaultFS</name>
<value>hdfs://BBDcluster</value>
<description></description>
</property>

<property>
<name>hadoop.tmp.dir</name>

<value>/home/hadoop/data/hdfs/tmp</value>
<description>A base for other temporary directories.</description>
</property>

<property>
<name>ha.zookeeper.quorum</name>
<value>hadoop-m:2181,hadoop-sm:2181,slave1:2181</value>
</property>

<property>
<name>ha.zookeeper.session-timeout.ms</name>
<value>1000</value>
<description>ms</description>
</property>
</configuration>
6.修改hdfs-site.xml配置文件

http://www.apache.org/licenses/LICENSE-2.0

<configuration>
<property>
<name>dfs.replication</name>
<value>2</value>
</property>

<property>
<name>dfs.namenode.name.dir</name>
<value>file:/home/hadoop/data/hdfs/name</value>
<final>true</final>
</property>
<property>
<name>dfs.datanode.data.dir</name>
<value>file:/home/hadoop/data/hdfs/data</value>
<final>true</final>
</property>
<property>
<name>dfs.webhdfs.enabled</name>
<value>true</value>
</property>
<property>
<name>dfs.nameservices</name>
<value>BBDcluster</value>
</property>
<property>
<name>dfs.ha.namenodes.BBDcluster</name>
<value>nn1,nn2</value>
</property>

<property>
<name>dfs.namenode.rpc-address.BBDcluster.nn1</name>
<value>hadoop-m:8020</value>
</property>
<property>
<name>dfs.namenode.rpc-address.BBDcluster.nn2</name>
<value>hadoop-sm:8020</value>
</property>

<property>
<name>dfs.namenode.http-address.BBDcluster.nn1</name>
<value>hadoop-m:50070</value>
</property>
<property>
<name>dfs.namenode.http-address.BBDcluster.nn2</name>
<value>hadoop-sm:50070</value>
</property>

<property>
<name>dfs.namenode.shared.edits.dir</name>
<value>qjournal://hadoop-m:8485;hadoop-sm:8485;slave1:8485/BBDcluster</value>
</property>

<property>
<name>dfs.journalnode.edits.dir</name>
<value>/home/hadoop/data/hdfs/journalnode</value>
</property>

<property>
<name>dfs.ha.automatic-failover.enabled</name>
<value>true</value>
</property>

<property>
<name>dfs.client.failover.proxy.provider.BBDcluster</name>
<value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>
</property>

<property>
<name>dfs.ha.fencing.methods</name>
<value>sshfence</value>
</property>
<property>
<name>dfs.ha.fencing.ssh.private-key-files</name>
<value>/home/hadoop/.ssh/id_rsa</value>
</property>

<property>
<name>dfs.ha.fencing.ssh.connect-timeout</name>
<value>30000</value>
</property>

<property>
<name>ha.failover-controller.cli-check.rpc-timeout.ms</name>
<value>60000</value>

</property>
</configuration>
7.修改mapred-site配置文件

<?xml version="1.0"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<!--
Licensed under the Apache License, Version 2.0 (the "License");
you may not use this file except in compliance with the License.
You may obtain a copy of the License at

http://www.apache.org/licenses/LICENSE-2.0

<configuration>
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
<property>
<name>mapreduce.jobhistory.address</name>
<value>hadoop-m:10020</value>
</property>
<property>
<name>mapreduce.jobhistory.webapp.address</name>
<value>hadoop-m:19888</value>
</property>
</configuration>

8.修改yarn-site.xml 配置文件

<?xml version="1.0"?>
<!--
Licensed under the Apache License, Version 2.0 (the "License");
you may not use this file except in compliance with the License.
You may obtain a copy of the License at

http://www.apache.org/licenses/LICENSE-2.0

<property>
<name>yarn.resourcemanager.ha.enabled</name>
<value>true</value>
</property>

<property>
<name>yarn.resourcemanager.cluster-id</name>
<value>yrc</value>
</property>

<property>
<name>yarn.resourcemanager.ha.rm-ids</name>
<value>rm1,rm2</value>
</property>

<property>
<name>yarn.resourcemanager.hostname.rm1</name>
<value>slave1</value>
</property>
<property>
<name>yarn.resourcemanager.hostname.rm2</name>
<value>slave2</value>
</property>
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
<property>
<name>yarn.log-aggregation-enable</name>
<value>true</value>
</property>
<property>
<name>yarn.log-aggregation.retain-seconds</name>
<value>86400</value>
</property>

<property>
<name>yarn.resourcemanager.recovery.enabled</name>
<value>true</value>
</property>

<property>
<name>yarn.resourcemanager.store.class</name>
<value>org.apache.hadoop.yarn.server.resourcemanager.recovery.ZKRMStateStore</value>
</property>

<property>
<name>yarn.resourcemanager.ha.id</name>
<value>rm1</value>
</property>

<property>
<name>yarn.resourcemanager.zk-address</name>
<value>hadoop-m:2181,hadoop-sm:2181,slave1:2181</value>
</property>
<property>
<name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>
<value>org.apache.hadoop.mapred.ShuffleHandler</value>
</property>

<property>
<name>yarn.resourcemanager.scheduler.class</name>
<value>org.apache.hadoop.yarn.server.resourcemanager.scheduler.capacity.CapacityScheduler</value>
</property>

</configuration>
9.修改slaves文件

hadoop-m
hadoop-sm
slave1
slave2

10.分发安装包

scp -r hadoop-2.7.5/ hadoop-sm:$PWD

scp -r hadoop-2.7.5/ slave1:$PWD

scp -r hadoop-2.7.5/ slave2:$PWD

11.配置环境变量

export JAVA_HOME=/usr/lib/jvm/jdk1.8.0_161
export JRE_HOME=${JAVA_HOME}/jre
export CLASSPATH=.:${JAVA_HOME}/lib/dt.jar:${JRE_HOME}/lib/rt.jar
export HADOOP_HOME=/usr/local/hadoop-2.7.5
export ZOOKEEPER_HOME=/usr/local/zookeeper-3.4.10
export PATH=$ZOOKEEPER_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin:${JAVA_HOME}/bin:$PATH

12.务必按照下面的步骤一步一步来

1、启动zookeeper

zkServer.sh start

jps查看QuorumPeerMain进程是否开启

查看是否成功选举

zkServer.sh status

2、在你配置的各个journalnode节点启动该进程（这里我们是hadoopm，hadoopsm，slave1）

hadoop-daemon.sh start journalnode

jps查看JournalNode进程是否开启

为了方便观察建议先删除zookeeper下的节点 rmr /xxxxx

3、格式化namenode

先选取一个namenode（hadoopm）节点进行格式化

选哪个都行，案例选择hadoopm

hadoop namenode -format

4、要把在hadoopm节点上生成的元数据给复制到 hadoopsm上

[hadoop@hadoop-m data]$scp -r hadoopdata/ hadoop03:$PWD

出现如下所示即为成功

VERSION 100% 206 0.2KB/s 00:00
fsimage_0000000000000000000 100% 322 0.3KB/s 00:00
fsimage_0000000000000000000.md5 100% 62 0.1KB/s 00:00
seen_txid 100% 2 0.0KB/s 00:00

5、格式化zkfc

只能在nameonde节点进行（案例在hadoopm节点格式化）

[hadoop@hadoopm data]$hdfs zkfc -formatZK

出现下图即为成功