一、本地运行模式
参考:http://dblab.xmu.edu.cn/blog/install-hadoop/
二、伪分布运行模式
参考:http://dblab.xmu.edu.cn/blog/install-hadoop/
三、完全分布式运行模式
-
准备3台客户机(关闭防火墙、设置静态
IP
、设置主机名称) -
安装
JDK
并配置环境变量 -
安装
Hadoop
并配置环境变量 -
配置集群文件
- 核心配置文件
core-site.xml
<!-- 指定HDFS中NameNode的地址 --> <property> <name>fs.defaultFS</name> <value>hdfs://hadoop102:9000</value> </property> <!-- 指定Hadoop运行时产生文件的存储目录 --> <property> <name>hadoop.tmp.dir</name> <value>/opt/module/hadoop-2.7.2/data/tmp</value> </property>
- 配置
hdfs-site.xml
,写入JAVA_HOME
路径 - 配置
hdfs-site.xml
<property> <name>dfs.replication</name> <value>3</value> </property> <!-- 指定Hadoop辅助名称节点主机配置 --> <property> <name>dfs.namenode.secondary.http-address</name> <value>hadoop104:50090</value> </property>
- 配置
yarn-env.sh
,写入JAVA_HOME
路径 - 配置
yarn-site.xml
<!-- Reducer获取数据的方式 --> <property> <name>yarn.nodemanager.aux-services</name> <value>mapreduce_shuffle</value> </property> <!-- 指定YARN的ResourceManager的地址 --> <property> <name>yarn.resourcemanager.hostname</name> <value>hadoop103</value> </property>
- 配置
mapred-env.sh
,写入JAVA_HOME
路径 - 配置
mapred-sit.xml
<!-- 指定MR运行在Yarn上 --> <property> <name>mapreduce.framework.name</name> <value>yarn</value> </property>
- 核心配置文件
-
设置单点启动
- 集群第一次启动需要格式化
NameNode
hadoop namenode -format
- 集群第一次启动需要格式化
-
配置
ssh
-
群起并测试集群