【若泽大数据实战第九天】MapReduce job运行案例 - 代码天地

【若泽大数据实战第九天】MapReduce job运行案例

其他 2019-03-02 14:07:21 阅读次数: 0

MapReduce运行词频统计案例

map 映射
reduce 规约

先做一个PI的案例：

hadoop jar ./share/hadoop/mapreduce2/hadoop-mapreduce-examples-2.6.0-cdh5.7.0.jar pi 5 10

在这里，看到的是先做的是map，map做完，做reduce，但是再生产上，很复杂，可能map只做了还不到一半就开始做reduce了。

词频统计案例：

vi a.txt 随便写入一些词

vi b.tx 随便写入一些词

hdfs dfs -ls /

hdfs dfs -mkdir /wordcount

hdfs dfs -mkdir /wordcount/input

hdfs dfs -put a.txt /wordcount/input

hdfs dfs -put b.tx /wordcount/input

hdfs dfs -ls /wordcount/input/

运行这句命令：\ 符号代表换行不执行

hadoop jar \
./share/hadoop/mapreduce2/hadoop-mapreduce-examples-2.6.0-cdh5.7.0.jar \
wordcount /wordcount/input /wordcount/output1

完成之后， hdfs dfs -ls /wordcount/output1 看一下：

第一个 _SUCCESS是0字节，是一个标识文件

第二个 part-r-00000表示结果集

用这个句命令hdfs dfs -cat /wordcount/output1/part-r-00000可以看到文件的内容：

用这句命令 hdfs dfs -get /wordcount/output1/part-r-00000 ./ 可以从hdfs上下载下来。

在yarn上面：http://ip:8088/cluster 可以看到相应的job。

猜你喜欢

转载自blog.csdn.net/liweihope/article/details/87905704

【若泽大数据实战第九天】MapReduce job运行案例

【若泽大数据实战第九天】Hadoop 编译

【若泽大数据实战第九天】hdfs三个进程以机器名启动的设置

【若泽大数据实战第九天】Yarn伪分布式部署及log日志分析

【若泽大数据实战第九天】jps命令和pid进程剖析

第九天 - MapReduce计算模型 - 案例

【若泽大数据实战第九天】Hadoop伪分布式模式部署 HDFS（root用户）

GIS案例练习-----------第九天

Mapreduce的Job运行流程

天津东软实训第九天——MapReduce实战

第九天

MR Job运行数据：

【若泽大数据实战第十二天】MapReduce学习

廖大python实战教程第九天

【若泽大数据实战第十天】Hadoo官网使用教程

【若泽大数据实战第七天】MySQL在DBeaver上的使用

【若泽大数据实战第二天】Linux命令基础

【若泽大数据实战第二天】Linux基础命令

【若泽大数据实战第三天】Linux基础命令二

【若泽大数据实战第八天】hadoop入门介绍

【若泽大数据实战第五天】MySQL部署

【若泽大数据实战第四天】Linux命令进阶

【若泽大数据实战第三天】Linux命令进阶

hadoop 之 mapreduce job 案例练习

若泽大数据实战学习--开始

如何获取hadoop mapreduce job运行信息

Mapreduce(MR)设置多个job的任务运行

数据结构【第九天】：树（三）

学习数据结构的第九天（三）

数据结构刷题：第九天

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)