大数据教程（8.1）mapreduce核心思想 - 代码天地

大数据教程（8.1）mapreduce核心思想

其他 2018-11-25 14:41:57 阅读次数: 0

上一章介绍了hadoop的HDFS文件系统的原理及API使用。本章博主将继续对hadoop的mapreduce编程框架进行分享。

mapreduce原理篇

mapreduce是一个分布式运算程序的编程框架，是用户开发“基于hadoop的数据分析应用”的核心框架；mapreduce的核心功能是将用户编写的业务逻辑代码和自带的默认组件整合成一个完整的分布式运算程序，并发运行在一个hadoop集群上；

为什么要mapreduce：

(1).海量数据在单机上处理因为硬件资源限制，无法胜任

(2).而一旦将单机版程序扩展到集群来分布式运行，将极大增加程序的复杂度和开发难度

(3).引入mapreduce框架后，开发人员可以将绝大部分工作集中在业务逻辑的开发上，而将分布式计算中的复杂性交由框架来处理

mapreduce的整体结构包含：一个完整的mapreduce程序在分布式运行时有三类实例进程;

        1.MRAppMaster(mapreduce application master)：负责整个程序的过程调度及状态协调
        2.MapTask：负责map阶段的整个数据处理流程
        3.ReduceTask：负责reduce阶段的整个数据处理流程

mapredcue核心框架设计思想:

最后寄语，以上是博主本次文章的全部内容，如果大家觉得博主的文章还不错，请点赞；如果您对博主其它服务器大数据技术或者博主本人感兴趣，请关注博主博客，并且欢迎随时跟博主沟通交流。

猜你喜欢

转载自my.oschina.net/u/2371923/blog/2878034

大数据教程（8.1）mapreduce核心思想

MapReduce的核心思想

MapReduce核心思想

浅谈大数据的起源和核心思想

Lesson 8.1 决策树的核心思想与建模流程

Hadoop_14_MapReduce原理_核心思想概述

【Hadoop学习之MapReduce】_14MR的核心思想

NoSql数据库核心思想

Thymeleaf 核心思想

Hadoop的核心思想

Vue核心思想

重要核心思想

ajax 的核心思想

mybatis 核心思想

laravel核心思想

编程的核心思想

redux核心思想

LSTM核心思想

springMVC核心思想

Vue核心思想：数据驱动、组件化

Future模式核心思想

SIFT算法核心思想

SpringMvc框架的核心思想

Smarty-核心思想

Spring中的核心思想

twoSum问题的核心思想

Spring(一)核心思想

Spark Mllib核心思想

【算法】-递归核心思想

《SQL优化核心思想》

今日推荐

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

“百模大战”必有一战 | 2024中国“百模大战”竞争格局分析

周排行

Family Tree 题解

BZOJ 1093 最大半连通子图 SCC + DP

幂等处理

Spring----学习（2）----XML 配置Bean 自动装配

SQL Server 远程更新目标表数据

HIbernate3.6 环境搭建

特殊符号正则表达式

【Linux】第一章进程的理解

843. n-皇后问题（dfs+输出各种情况）

空间数据库2

每日归档

更多

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)

2024-04-17(5)