hadoop-2.9.2 HA集群搭建

确保每台机器上都有jdk,以下是机器配置。

应用/主机名 zk1 zk2 zk3 namenode1 namenode2 datanode1 datanode2 datanode3  
zookeeper y  y y            
namenode       y y        
datanode           y y y  
journalnode           y y y  
zkFC       y y        
resourcemanger       y y        
nodemanager           y y y  
                   
                   

1、3台zk,前面的博客已经搭建好了,我只是克隆几台,改了ip,不影响使用。

启动3台zk.

查看状态如果是上面的状态,那就ok.

2、准备两台namenode1,namenode2

  我的hadoop位置

进入hadoop 配置文件目录,cd /hadoop-2.9.2/etc/hadoop

1).vi hdfs-site.xml

<property>
<name>dfs.nameservices</name>
<value>laolong</value>
</property>
<property>
<name>dfs.ha.namenodes.laolong</name>
<value>nn1,nn2</value>
</property>
<property>
<name>dfs.namenode.rpc-address.laolong.nn1</name>
<value>namenode1:8020</value>  //两台namenode
</property>
<property>
<name>dfs.namenode.rpc-address.laolong.nn2</name>
<value>namenode2:8020</value> 
</property>
<property>
<name>dfs.namenode.http-address.laolong.nn1</name>
<value>namenode1:50070</value> 
</property>
<property>
<name>dfs.namenode.http-address.laolong.nn2</name>
<value>namenode2:50070</value> 
</property>
<property>
<name>dfs.namenode.shared.edits.dir</name>
<value>qjournal://datanode1:8485;datanode2:8485;datanode3:8485/abc</value>
</property>

<property>
<name>dfs.client.failover.proxy.provider.laolong</name>
<value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>
</property>
<property>
<name>dfs.ha.fencing.methods</name>
<value>sshfence</value>
</property>
<property>
<name>dfs.ha.fencing.ssh.private-key-files</name>
<value>/root/.ssh/id_rsa</value>
</property>
<property>
<name>dfs.journalnode.edits.dir</name>
<value>/opt/journalnode</value>
</property>
<property>
<name>dfs.ha.automatic-failover.enabled</name>
<value>true</value>
</property>

2).vi core-site.xml

<property>
<name>fs.defaultFS</name>
<value>hdfs://laolong</value>
</property>
<property>
<name>hadoop.tmp.dir</name>
<value>/opt/hadoop-2.9</value>
</property>
<property>
<name>ha.zookeeper.quorum</name>
<value>zk1:2181,zk2:2181,zk3:2181</value>
</property>

3).vi slaves

 4).vi yarn-site.xml

<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
<property>
<name>yarn.resourcemanager.ha.enabled</name>
<value>true</value>
</property>
<property>
<name>yarn.resourcemanager.cluster-id</name>
<value>lyhadoop</value>
</property>
<property>
<name>yarn.resourcemanager.ha.rm-ids</name>
<value>rm1,rm2</value>
</property>
<property>
<name>yarn.resourcemanager.hostname.rm1</name>
<value>namenode1</value>
</property>
<property>
<name>yarn.resourcemanager.hostname.rm2</name>
<value>namenode2</value>
</property>
<property>
<name>yarn.resourcemanager.zk-address</name>
<value>zk1:2181,zk2:2181,zk2:2181</value>
</property>

 5).vi hadoop-env.sh

 6).先启动三个JournalNode:./hadoop-daemon.sh start journalnode

 7).在其中一个namenode上格式化:hdfs namenode -format

8).把格式化的文件拷贝到另一台namenode上,可以通过scp方式拷贝

9).在其中一个namenode上初始化zkfchdfs zkfc -formatZK

10).启动集群:start-dfs.sh             stop-dfs.sh  停止

启动 后,通过浏览器访问

访问另一台namenode

 假如把active的namenode  kill  ,看看能不能实现自动切换呢?

namenode1 不能访问了

 那namenode2呢?

 这样就实现了namenode的切换。

11).start-yarn.sh

启动后,如下

至此,完成HA集群搭建。只是记录我学习的,很多不明白的,希望大家指点。

猜你喜欢

转载自www.cnblogs.com/longyao/p/11430280.html