Experiment 10. Hadoop environmental structures

Disclaimer: This article is a blogger original article, follow the CC 4.0 BY-SA copyright agreement, reproduced, please attach the original source link and this statement.
This link: https://blog.csdn.net/shuai0845/article/details/84843053

1. Purpose

Preliminary understanding of Hadoop, understand Hadoop.

2. Experimental Platform

Operating System: Windows + Vmware

3. experimental content and requirements

JDK Linux system installation and configuration;

HelloWorld under Linux system;

Hadoop Distributed standalone configuration and testing;

4. Experimental Report

JDK Linux system installation and configuration;

First jkd file copying linux system / simple directory

Implementation of tar -xvf jdk-8u191-linux-x64.tar.gz

Edit / etc / profile file

Implementation of source / etc / profile

Implementation of java, javac, java -version view is correct

HelloWorld under Linux system;

Execute cd / simple

Execute vi HelloWorld.java follows

public class HelloWorld {

public static void main(String[] args) {

System.out.println("HelloWorld");

}

}

HelloWorld completed under Linux

Hadoop Distributed standalone configuration and testing;

First Hadoop file copying / under simple

执行 tar -xvf hadoop-2.7.1.tar.gz

Edit / etc / profile file

Execution source / etc / profile

Switch to the directory /simple/hadoop-2.7.1/etc/hadoop

编辑hadoop-env.sh文件,在文件内添加export JAVA_HOME=/simple/jdk1.8.0_191/

 

在/simple/hadoop-2.7.1/bin下新建一个input目录mkdir input

将/simple/hadoop-2.7.1/etc/hadoop目录下所有以.xml文件拷贝到/simple/input下

命令为cp /simple/hadoop-2.7.1/etc/hadoop/*.xml  input

执行hadoop jar /simple/hadoop-2.7.1/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.1.jar grep  input output 'number' 这条命令是查找一下input目录文件内容中number出现的次数,将结果保存在output目录下part-r-00000文件中,查看一下

显示出现五次,我们用命令产看一下结果对不对

发现number出现的次数就是五次,

Hadoop单机分布式配置与测试到这就完成了。

Hadoop伪分布式配置与测试;

这个实验在上个实验基础上做,

在 $HADOOP_HOME/etc/hadoop 目 录 下 执 行 编辑core-site.xml配 置 文 件

修改 core-site.xml 的 内容如下

在 $HADOOP_HOME/etc/hadoop 目 录 下 执 行编辑 hdfs-site.xml 并 修 改 配 置 文 件 hdfs-site.xml修改内容如下

    在$HADOOP_HOME/etc/hadoop 目录下查看是否有配置文件 mapred-site.xml。目录下 默 认 情 况 下 没 有 该 文 件 , 可 通 过 执 行 如 下 命 令 : cp mapred-site.xml.template mapred-site.xml备份文件并重命名,然后执行编辑文件mapred-site.xml 并修 改该文件

内容如下

在$HADOOP_HOME/etc/hadoop 目录下编辑yarn-site.xml配置文件内容如下

格式化 namenode。在任意目录下执行如下命令进行格式化:hdfs namenode -format 或者 hadoop namenode -format 。 如图  所示

启动 hadoop, 首先启动 hdfs:start-all.sh输入密码就行了

完成后输入jps

测 试 hdfs 和 yarn ( 推 荐 火 狐 浏 览 器 ), 首 先 在 浏 览 器 地 址 栏 中 输 入 :

http://192.168.125.128:50070 (HDFS 管理界面)(本 IP 为自己虚拟机上面的 IP,端口不变)

在浏览器的地址栏中输入:http://192.168.125.128:8088 (MR 管理界面)(本 IP 为自

己虚拟机上面的 IP,端口不变)。如图 所示

Hadoop伪分布式配置与测试完成

5.实验总结

              Jdk的配置与HelloWorld的编写很简单,大家曾经都做过,应该不会有问题。Hadoop单机分布式配置与测试,这个配置很简单,就配置一下环境变量,可能有人在最后一步执行命令出现地址解析错误,修改一下/etc/hosts问价,将127.0.0.1指向本机主机名就行了。

Guess you like

Origin blog.csdn.net/shuai0845/article/details/84843053