MapReduce入门 - 代码天地

MapReduce入门

其他 2018-09-04 15:35:28 阅读次数: 0

MapReduce入门

其实我们首先可以从 wordCount实例中来理解MapReduce，MapReduce可以分为6步骤：input，split，map，shuffle，reduce，output。
1.input ：给定文档，包括如下信息：

Hello Java
Hello C
Hello Java
Hello C++
2.split：将上述文档中每一行的内容转化为 key-value
0 - Hello Java
1 - Hello C
2 – Hello Java
3 - Hello C++
3.map：将拆分之后的内容转化成新的key-value对，
(Hello，1)
(Java，1）
(Hello , 1)
(C , 1)
(Hello , 1)
(Java , 1)
(Hello , 1)
(C++ , 1)
4.shuffle :将key相同的扔到一起去
(Hello , 1)
(Hello , 1)
(Hello , 1)
(Hello , 1)
(Java , 1)
(Java , 1)
(C ,1)
(C++,1)

注意：这一步需要移动数据，原来的数据可能在不同的datanode上，这一步过后，相同key的数据会被移动到同一台机器上。最终，它会返回一个list包含各种k-value对，即：

{ Hello: 1,1,1,1}
{Java: 1,1}
{C: 1}
{C++: 1}

5.reduce:把同一个key的结果加在一起
- (Hello , 4)
- (Java , 2)
- (C , 1)
- (C++,1)

6.output：输出缩减之后的所有结果

猜你喜欢

转载自blog.csdn.net/qq_31430665/article/details/80532323

MapReduce入门

MapReduce的入门

MapReduce入门：11、mapreduce程序的入门

MapReduce入门：11、mapreduce程序的入门-2

mapReduce入门教程

Hadoop MapReduce入门

7-MapReduce入门

MapReduce的通俗理解与入门

MapReduce 基础入门

MapReduce简单入门 wordcount

Hadoop入门（7）--MapReduce

MapReduce入门详解（三）

MapReduce入门详解（二）

MapReduce入门详解（一）

MapReduce入门详解（一）

mapreduce入门案例wordcount

一、MapReduce入门

MapReduce基础入门（二）

MapReduce基础入门（一）

Hadoop MapReduce 入门

mapreduce 函数入门三

MapReduce-Shuffle入门

05 mapreduce快速入门

MapReduce从入门到精通

MapReduce入门了解

Hadoop --- MapReduce 入门

MapReduce编程快速入门

Hadoop MapReduce 入门实例

快速入门MapReduce② MapReduce的分区与ReduceTask的数量

MapReduce快速入门系列(1) | 什么是MapReduce

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

周排行

Python环境安装与基础语法（1）——计算机基础知识

IMU预积分

ADAS中的LDW、FCW、BSD、LCA、ACC、AEB、APA、DMS代表的含义

B站笔试两道题

skyeye arm 硬件虚拟机环境的搭建

Web前端静态页面示例

数组-合并排序数组 II-简单

springcloud之版本问题启动报错

面向对象-------------匿名对象(六)

输入URL到页面呈现中间发生了什么？

每日归档

更多

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)