# Hadoop MapReduce（一）

其他 2020-02-11 09:38:15 阅读次数: 0

Hadoop MapReduce（一）

Hadoop MapReduce是一个使用简易的框架。一个Map/Reduce作业通常会将输入的数据集切分成多个数据块，以Map方式并行的处理它们，框架会对map的输出先进行排序，然后把结果输入给reduce任务。
Hadoop框架是用java语言实现的，但是Map/Redudce不一定要用java
Map/Reduce框架运转在<key, value> 键值对上，也就是说，框架把作业的输入看为是一组<key, value> 键值对，同样也产出一组 <key, value> 键值对做为作业的输出，这两组键值对的类型可能不同。

单词统计例子

首先在HDFS中创建用户目录，执行下面命令

./bin/hdfs dfs -mkdir -p /version/hadoop/user/hadoop

在 HDFS 中创建输入目录，这里使用的是 hadoop 用户，并且已创建相应的用户目录 /user/hadoop ，因此在命令中就可以使用相对路径如 input，其对应的绝对路径就是 /user/hadoop/input：

./bin/hdfs dfs -mkdir input

将jar包复制到HDFS目录下面，即放到/version/hadoop/user/hadoop/input下面

./bin/hdfs dfs -put ../code/hadoop.jar /version/hadoop/user/hadoop/input

复制完成后，可以通过如下命令查看文件列表：

./bin/hdfs dfs -ls /version/hadoop/user/hadoop/input

运行MapReduce重点

-jar 后面为本地的hadoop.jar文件所在的位置
-wordCount.WordCount为单词统计例子的运行类
-后面的input 和output为在hdfs中的位置
# ./bin/hadoop  jar ../code/hadoop.jar wordcount.WordCount /version/hadoop/user/root/input /version/hadoop/user/root/output

运行结果

./bin/hdfs dfs -cat output/*

删除hdfs中的文件夹

./bin/hdfs dfs -rm -r output    # 删除 output 文件夹

MarlonBrando1998

发布了123 篇原创文章 · 获赞 9 · 访问量 3979

私信关注

猜你喜欢

转载自blog.csdn.net/qq_37248504/article/details/104083421

# Hadoop MapReduce（一）

Hadoop-Mapreduce(一）

Hadoop笔记（一） MapReduce介绍

Hadoop MapReduce程序开发（一）

Hadoop MapReduce（一）------ wordcount学习

Hadoop之MapReduce学习(一)

Hadoop mapreduce

hadoop的MapReduce

Hadoop - MapReduce

Hadoop（MapReduce）

Hadoop—MapReduce

hadoop --- MapReduce

MapReduce计算模型二 MapReduce框架Hadoop应用(一)

一张图精通Hadoop的MapReduce

基于mapreduce的Hadoop join实现分析(一)

Hadoop-MapReduce粗略理解（一）

Hadoop Core_MapReduce总结（一）

初学Hadoop：mapreduce的一些理解

Hadoop入门之MapReduce实例一

《Hadoop权威指南》笔记(一) --- 初识Hadoop与MapReduce

Hadoop理论之MapReduce

hadoop--关于MapReduce

Hadoop-MapReduce

Hadoop MapReduce表关联

hadoop (mapreduce运行原理)

Hadoop 2.7.5 MapReduce Commit

Hadoop 2.7.5 MapReduce JobHistoryParser

Hadoop 2.7.5 MapReduce Recovery

Hadoop MapReduce的特性

Hadoop MapReduce框架详解

今日推荐

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

周排行

计算机组成与设计（七）—— 除法器

Integer Approximation(分治+枚举)

大话数据库索引

windows10系统JDK的配置及下载地址

mysql实现秒值转换中原六仔平台搭建

Codeforces Round #556 (Div. 1)

百练1064 网线主管

Codeforces 995F Cowmpany Cowmpensation

子集生成之增量构造法，位向量法，二进制法

ERROR: cmd.exe failed with args /c "/APK\gradle\rungradle.bat...

每日归档

更多

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)