Hadoop-2.7.2伪分布式的搭建

Hadoop-2.7.2伪分布式的搭建

1.解压hadoop到当前目录

tar -zxvf hadoop-2.7.2.tar.gz -C ./ 

解压后的目录:
请添加图片描述

2.修改映射

vim /etc/hosts

请添加图片描述

3.为hadoop设置环境变量

(默认Java环境变量已经配置)

pwd 获取hadoop所在的位置
请添加图片描述

编辑 /etc/profile 文件

vim /etc/profile
#配置Hadoop环境变量
export HAOOP_HOME=/opt/Environment/hadoop-2.7.2
export PATH=$HADOOP_HOME/bin:$PATH

请添加图片描述
hadoop指令查看hadoop环境变量是否配置完成!

hadoop

请添加图片描述
修改hadoop-env,sh里面的java环境变量

export JAVA_HOME=/opt/Environment/java

4.配置hadoop文件(etc/hadoop/core-site.xml)

etc/hadoop/目录下的文件
请添加图片描述

在etc/hadoop/core-site.xml中添加:

vim core-site.xml
<configuration>
	<!--配置文件系统默认的机器(namenode)-->
	<property>
		<name>fs.defaultFS</name>
		<value>hdfs://C8:8020</value>
	</property>

	<!--文件系统缓存目录-->
	<property>
		<name> hadoop.tmp.dir</name>
		<value>/opt/Environment/hadoop-2.7.2/data/tmp</value>
	</property>
</configuration>

etc/hadoop/hdfs-site.xml添加后
请添加图片描述
在hadoop目录下创建/data/temp

mkdir -p /data/tmp

5.配置hadoop文件(etc/hadoop/hdfs-site.xml)

etc/hadoop/hdfs-site.xml中添加:

vim hdfs-site.xml
<configuration>
	<!--单机模式下文件备份为1份-->
	<property>
		<name>dfs.replication</name>
		<value>1</value>
	</property>
</configuration>

xml添加后
请添加图片描述

6.开启namenode,datanode

切换到hadoop目录下执行以下命令

格式化namenode

bin/hdfs namenode -format

启动namenode 和 datanode

sbin/hadoop-daemon.sh start namenode
sbin/hadoop-daemon.sh start datanode

开启namenode,datanode
请添加图片描述

jps

请添加图片描述

7.配置yarn

1.配置etc/hadoop/yarn-site.xml
vim yarn-site.xml
<configuration>
	<!-- 配置resourcemanager节点所在的机器 -->
	<property>
		<name>yarn.resourcemanager.hostname</name>
		<value>C8</value>
	</property>
</configuration>

请添加图片描述
2.配置etc/hadoop/mapred-site.xml

拷贝 mapred-site.xml.template,改名为mapred-site.xml

cp mapred-site.xml.template mapred-site.xml

修改配置文件

vim mapred-site.xml
<configuration>
	<!-- Reducer获取数据的方式 -->
	<property>
       <name>yarn.nodemanager.aux-services</name>
       <value>mapreduce_shuffle</value>
	</property>
	<!-- 表示把资源管理工作交给yarn管理 -->
	<property>
		<name>mapreduce.framework.name</name>
		<value>yarn</value>
	</property>
</configuration>

请添加图片描述

3.etc/hadoop/yarn-env.sh添加 java环境变量

请添加图片描述

8.启动yarn

sbin/yarn-daemon.sh start resourcemanager
sbin/yarn-daemon.sh start nodemanager

请添加图片描述
jps查看进程
请添加图片描述

进入yarn
http://192.168.192.133:8088
进入hdfs
http://192.168.192.133:50070

请添加图片描述
请添加图片描述


9.节点关闭的命令(有先后顺序)

关闭nodemanager 	sbin/yarn-daemon.sh stop nodemanager
关闭resourcemanager	sbin/yarn-daemon.sh stop resourcemanager
关闭namenode	    sbin/hadoop-daemon.sh stop namenode
关闭datanode	    sbin/hadoop-daemon.sh stop datanode
sbin/yarn-daemon.sh stop nodemanager
sbin/yarn-daemon.sh stop resourcemanager
sbin/hadoop-daemon.sh stop namenode
sbin/hadoop-daemon.sh stop datanode

10.配置历史服务器

配置etc/hadoop/mapred-site.xml中添加如下配置

<property>
		<name>mapreduce.jobhistory.address</name>
		<value>H520:10020</value>
</property>
<property>
		<name>mapreduce.jobhistory.webapp.address</name>
		<value>H520:19888</value>
</property>

请添加图片描述

启动历史服务器

sbin/mr-jobhistory-daemon.sh start historyserver

关闭历史服务器

sbin/mr-jobhistory-daemon.sh stop historyserver

11.配置日志的聚集

配置etc/hadoop/yarn-site.xml中添加如下配置

注意:开启日志聚集功能需要重新启动NodeManager,ResourceManger和HistoryManager

在hadoop目录下执行:

vim ./etc/hadoop/yarn-site.xml

配置文件中添加如下属性

<property>
	<name>yarn.log-aggregation-enable</name>
	<value>true</value>
</property>
<!-- 日志保留时间设置7天 -->
<property>
	<name>yarn.log-aggregation.retain-seconds</name>
	<value>604800</value>
</property>

请添加图片描述

猜你喜欢

转载自blog.csdn.net/weixin_46466198/article/details/121000288