Hadoop之本地运行模式_学习笔记

贴上官方文档:

https://hadoop.apache.org/docs/stable/hadoop-project-dist/hadoop-common/SingleCluster.html

这里的一个障碍,就是英文.不要虚就是上,hhh.读的越多,越熟练。

  1. 首先配置 /etc/hadoop/hadoop-env.sh
    这里需要更改JAVA_HOME,直接这里替换成你的JDK的安装路径,一般来说应该是在module文件夹里
  2. 然后接下来你可以检测一下自己是否已经成功有了Hadoop的环境,输入如下代码:
bin/hadoop

效果图:
在这里插入图片描述
3. 在hadoop的bin的根目录穿件一个input文件夹
4. 接下来将

cp etc/hadoop/*.xml input
  1. 这里的含义是运行在share中的jar包,然后这里测试的主类是exaples,即是Hadoop中的一个样例程序,注意这里的output一定是一个不存在的文件夹.
bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-3.2.1.jar grep input output 'dfs[a-z.]+'
  1. 查看ouput文件夹,如果有输出,则表明Hadoop的本地运行没有什么问题了,就相当于最开始学习C语言时候的HelloWorld
    命令:
cat output/*

在这里插入图片描述

案列二
测试wordcount类

  1. 创建一个输入文件夹 wcinput,并在文件夹里面编辑一个input文件
mkdir wcinput
vim wc.input

运行效果:
在这里插入图片描述
2. 在bin的根目录里面
使用命令:

bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.6.5.jar wordcount wcinput wcoutput

  1. 查看wcoutput信息
cat wcoutput/*

在这里插入图片描述
over;
本地模式的用途一般只用于测试。
That’s all.

发布了179 篇原创文章 · 获赞 1 · 访问量 7568

猜你喜欢

转载自blog.csdn.net/weixin_42596275/article/details/105465013