Hadoop学习之Hadoop集群安装

集群中的计算机在时间上要同步，系统时间不能差太多（秒级），如果设置时间后重启时间又不准确了（主板电池老化），可以启用NTP（Network Time Protocol网络时间协议）服务解决。
集群中的计算机在网络上能够相互访问
1. 全部实现免密码SSH访问（可以统一密钥对）
2. 全部实现Hosts解析
3. 全部关闭防火墙
4. 固定IP，要规划好IP地址和主机名
5. 虚拟机的网络使用桥接模式（如果在同一台物理机内的虚拟机间搭集群可以用NAT模式）

网络规划

3. 查看防火墙状态 firewall-cmd --state

下载想要安装的Hadoop版本，把安装包放在linux指定的文件夹下，如/home/hadoop-2.7.4.tar.gz
解压tar -xzf hadoop-2.7.4.tar.gz
移动到相应的位置 mv hadoop-2..7.4 /home/hadoop
打开hadoop-evn.sh指定JDK位置

# The java implementation to use.

export JAVA_HOME=JDK位置
打开core-site.xml指定NameNode

        <property>

                <name>fs.defaultFS</name>

                <value>hdfs://master:9000</value>

   </property>

   <property>

   <name>hadoop.tmp.dir</name>

   <value>/app/hadoop/tmp</value>

   <description>Parent directory for other temporary directories.</description>

</property>
打开hdfs-site.xml指定SecondaryNameNode

        <property>

                <name>dfs.namenode.secondary.http-address</name>

                <value>hdfs://master:50090</value>

</property>

<property>

   <name>dfs.namenode.name.dir</name>

   <value>file:/home/hadoop/tmp/dfs/name</value>

</property>

<property>

<name>dfs.datanode.data.dir</name>

<value>file:/home/hadoop/tmp/dfs/data</value>

   </property>

   <property>

<name>dfs.datanode.max.xcievers</name>

<value>16000</value>

<description>增大xcievers个数</description>

       </property>

        注：以上只配置了HDFS，MapReduce等配置项随后使用时再添加