MapReduce简介及优缺点 - 代码天地

MapReduce简介及优缺点

其他 2021-03-27 23:51:53 阅读次数: 0

1、什么是MapReduce?

MapReduce是一种大规模数据处理的编程模型，用于大规模数据集的并行运算。Mapreduce核心功能是将用户编写的业务逻辑代码和自带默认组件整合成一个完整的分布式运算程序，并发运行在一个hadoop集群上。并以一种可靠的，具有容错能力的方式并行地处理上TB级别的海量数据集

2、为什么要使用MapReduce?

海量数据在单机上处理因为硬件资源限制，无法胜任而一旦将单机版程序扩展到集群来分布式运行，将极大增加程序的复杂度和开发难度引入mapreduce框架后，开发人员可以将绝大部分工作集中在业务逻辑的开发上，而将分布式计算中的复杂性交由框架来处理。
mapreduce分布式方案考虑的问题

运算逻辑要不要先分后合？
程序如何分配运算任务（切片）？
两阶段的程序如何启动？如何协调？
整个程序运行过程中的监控？容错？重试？
分布式方案需要考虑很多问题，但是我们可以将分布式程序中的公共功能封装成框架，让开发人员将精力集中于业务逻辑上。而mapreduce就是这样一个分布式程序的通用框架。

3、MapReduce的优点

模型简单,易于编程
它简单的实现一些接口，就可以完成一个分布式程序，这个程序可以分布到大量的廉价的pc机器上运行。也就是说你写一个分布式程序，跟写一个简单的串行程序是一模一样的。就是因为这个特性使的Mapreduce编程变得非常流行。
良好的扩展性
项目当你的计算资源得不到满足的时候，你可以通过简单的通过增加机器来扩展它的计算能力，
灵活
结构化和非结构化数据
并行处理
编程模型天然支持并行处理，适合PB级以上海量数据的离线处理
容错能力强
Mapreduce的设计初衷就是使程序能够部署在廉价的pc机器上，这就要求它具有很高的容错性。比如一个机器挂了，它可以把上面的计算任务转移到另一个节点上运行，不至于这个任务运行失败，而且这个过程不需要人工参与，而完全是由hadoop内部完成的。

4、MapReduce的缺点

不擅长实时计算
Mapreduce无法做到像Mysql那样做到毫秒或者秒级的返回结果
不擅长流式计算
流式计算的输入数据是动态的，而Mapreduce的输入数据集是静态的，不能流态变化。这是Mapreduce自身的设计特点决定了数据源必须是静态的。
不擅长DAG(有向图)计算
多个应用程序存在依赖关系，后一个应用程序的输入为前一个应用程序的输出，在这种情况下，Mapreduce并不是不能做，而是使用后每个Mapreduce作业的输出结果都会写入到磁盘，会造成大量的磁盘IO，导致性能非常低下。

参考：Mapreduce的优缺点

猜你喜欢

转载自blog.csdn.net/ytangdigl/article/details/109223914

MapReduce简介及优缺点

Dubbo简介及优缺点

zabbix简介及优缺点

MapReduce的优缺点是什么？

docker简介以及优缺点

MySQL视图简介及优缺点

hadoop SequenceFile 简介／优缺点

Mybatis简介和优缺点

ORM框架简介及优缺点

Vue的简介和优缺点

DeepWalk模型的简介与优缺点

Python简介、历史及优缺点

java 多线程简介优缺点

语音识别模型优缺点简介（一）

ORM的简介、概述以及优缺点

Node.js的简介及优缺点

HIVE简介、优缺点及架构原理

Lombok简介、使用、工作原理、优缺点

大数据开发实战：HDFS和MapReduce优缺点分析

【Hadoop学习之MapReduce】_13MR的优缺点

优缺点

总结贴策略讲堂的重点策略简介，优缺点分析

【机器学习】每种算法的简介+优缺点总结

mysql触发器之优缺点简介

Spring Boot功能概述及优缺点简介

Python07（Python简介07—Python的优缺点）

开源JAVA单机爬虫框架简介,优缺点分析

mybatis简介和优缺点以及使用场景

NoSQL数据库的简介以及优缺点

RNA干扰各种方法优缺点简介?

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)