hadoop运行模式（伪分布式）——启动HDFS并运行Mapreduce - 代码天地

hadoop运行模式（伪分布式）——启动HDFS并运行Mapreduce

其他 2020-04-24 12:02:20 阅读次数: 0

0.伪分布式：只有一个节点的分布式（主要通过配置伪分布式了解分布式需要配饰的文件及步骤）

启动HDFS并运行Mapreduce

	1.1 配置集群（配置文件的目录-/opt/module/hadoop-2.7.2/etc/hadoop）

export JAVA_HOME=/opt/module/jdk1.8.0_144

1.1.2 配置core-site.xml(主要高速hadoop运行运行模式等信息)

<configuration> 
			        <!--指定HDFS中NameNode的地址-->
			        <property>
			                <name>fs.defaultFS</name>
			                <value>hdfs://hadoop101:9000</value>
			        </property>
			        <!--指定hadoop运行时产生的文件的存储目录-->
			        <property>
			                <name>hadoop.tmp.dir</name>
			                <value>/opt/module/hadoop-2.7.2/data/tmp</value>
			        </property>
			</configuration>

1.1.3 配置hdfs-site.sh(存储数据副本-1)

<configuration>
				        <!--指定HDFS副本的数量，伪分布只需要1份-->
				        <property>
				                <name>dfs.relication</name>
				                <value>1</value>
				        </property>
				</configuration>

1.2 启动集群
1.2.1 格式化NameNode（第一次启动时格式化）

bin/hdfs namenode -format

1.2.2 启动NameNode

sbin/hadoop-daemon.sh start namenode

1.2.3 启动DataNode

sbin/hadoop-daemon.sh start datanode

1.3 查看集群
1.3.1 本地查看

jps

1.3.2 web端查看

http://hadoop7:50070/

1.4 操作集群
1.4.1 在HDFS文件系统上创建一个input文件夹
bin/hdfs dfs -mkdir -p /user/root/input
1.4.2 将测试文件内容上传到HDFS文件系统上
bin/hdfs dfs -put wcinput/wc.input /user/root/input
1.4.3 查看文件是否上传成功
bin/hdfs dfs -ls /user/root/input
bin/hdfs dfs -cat /user/root/input/wc.input
1.4.4 运行MapReduce程序
bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.2.jar wordcount /user/root/input/ /user/root/output
1.4.5 查看结果
bin/hdfs dfs -cat /user/root/output/*
http://hadoop7:50070/explorer.html#/user/root/output

Leslie_mc

发布了4 篇原创文章 · 获赞 3 · 访问量 162

私信关注

猜你喜欢

转载自blog.csdn.net/m0_46201836/article/details/105682429

hadoop伪分布式运行模式---启动HDFS并运行MapReduce程序

hadoop运行模式（伪分布式）——启动HDFS并运行Mapreduce

伪分布式的搭建（启动HDFS并运行MapReduce程序）

hadoop伪分布式运行模式---启动YARN并运行MapReduce程序

Hadoop的运行模式（伪分布式）——启动YARN并且运行MapReduce程序

伪分布式运行Hadoop实例之HDFS运行MapReduce程序

Hadoop运行模式之伪分布式运行模式

hadoop伪分布式之启动HDFS并运行MR程序（WordCount）

hadoop伪分布式运行模式---配置日志的聚集

Hadoop-伪分布式运行模式（三）

Hadoop-伪分布式运行模式（二）

Hadoop-伪分布式运行模式（一）

伪分布式运行Hadoop实例之yarn运行MapReduce实例

Hadoop伪分布式运行实例

Lesson3 Hadoop 伪分布式模式集群运行情况的查看、HDFS文件系统的简单管理操作

伪分布式运行模式

基于Hadoop的HDFS的分布式系统，运行Mapreduce任务出现问题的解决方法

啃掉Hadoop系列笔记(04)-Hadoop运行模式之伪分布式模式

Hadoop三种运行模式（单机模式、伪分布式模式、全分布式集群模式）

伪分布式的搭建（YARN上运行MapReduce 程序）

CentOS 7+Hadoop-2.7.2的hadoop环境搭建（二）伪分布式运行模式

hadoop完全分布式运行模式

Hadoop 运行模式（本地模式 / 分布式运行模式）

Hadoop运行模式之本地模式和伪分布式

Hadoop学习笔记_4：运行模式之伪分布式模式

Hadoop（第一天，概念，搭建hadoop环境，在hdfs下运行伪分布式）

hadoop伪分布式运行模式---配置历史服务器

单节点（伪分布式）环境下运行Hadoop

使用本地hadoop运行伪分布式程序

伪分布式运行Hadoop 案例-03

今日推荐

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

周排行

static方法和非static方法的区别（java）

如何查找计算机专业paper

java.lang.ClassFormatError: Incompatible magic value 0 in class file com/sitecha

跳跃游戏II

stm32_之【建立工程】

TeaWeb v0.0.9 发布，统计底层优化、主机监控功能改进

事件分发 -----控制字体大小

JavaScript DOM练习（动态表格添加） December 25，2019

JSF Scope & CDI

实现从零搭建一个登录注册页面（附源代码）

每日归档

更多

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)