MapReduce: Simpliﬁed DataProcessingonLargeClusters阅读笔记 - 代码天地

MapReduce: Simpliﬁed DataProcessingonLargeClusters阅读笔记

编程语言 2019-04-22 21:30:35 阅读次数: 0

论文地址

https://static.googleusercontent.com/media/research.google.com/zh-CN//archive/mapreduce-osdi04.pdf

一、背景

在阅读这篇论文之前，需要了解以下概念。

1、数据密集型应用 vs 计算密集型应用

数据密集型应用大概就是数据量很大但计算逻辑比较简单地应用，如大数据量的排序。而计算密集型应用则相反，其大部分时间用来做计算、逻辑判断等CPU操作，如一个计算圆周率到小数点后一千位以下的程序就是计算密集型应用。计算密集型应用相关的概念有高性能计算、超级计算、网格计算等。

两者都是基于分布式，但两者又存在区别。传统的计算密集型应用往往通过并行计算方式，在紧耦合的超级计算机上运行少量计算作业，即一个作业同时占用大量的计算机节点。而数据密集型应用则通常是将大量独立的数据分析处理作业分布在松耦合的计算机集群的不同节点上运行，有高度密集的海量数据I/O吞吐需求，并且大部分数据密集型应用都有个数据流驱动的流程。

关于数据密集型应用的知识可以看下面这本书：

https://book.douban.com/subject/30329536/

https://github.com/Vonng/ddia

2、分布式、并行、并发

分布式：与分布式对应的是单机，比如我们的个人PC就可以看成一个单机系统，具有一定的计算、存储等资源。

并行：注意并行与并发的区别

3、摩尔定律的失效；单核CPU向多核CPU的发展

意味着编程方式的转变：由顺序编程转向并行编程

一、什么是MapReduce？MapReduce可以做什么？

二、MapReduce是如何工作的？（）

三、MapReduce的编程思想

分而治之

四、MapReduce的优化

猜你喜欢

转载自blog.csdn.net/sinat_30973431/article/details/89453855

MapReduce: Simpliﬁed DataProcessingonLargeClusters阅读笔记

MapReduce 阅读笔记

MapReduce 论文阅读笔记

MapReduce paper(2004)-阅读笔记

MapReduce笔记

Hadoop实战阅读笔记，Mapreduce,hdfs,

MapReduce的工作原理-笔记

MongoDB MapReduce学习笔记

学习笔记-MapReduce

深入解析mapreduce 笔记

【Hadoop学习笔记】——MapReduce

【hadoop学习笔记】---MapReduce

学习笔记：MapReduce的类型

MapReduce笔记一

Mapreduce学习笔记（二）

Mapreduce学习笔记 (一)

mapreduce 学习笔记

MapReduce学习笔记

MapReduce学习笔记(2)

MapReduce学习笔记(1)

hadoop mapreduce 异常笔记

Hadoop与MapReduce学习笔记

Hadoop学习笔记--MapReduce

Hadoop学习笔记——MapReduce

MapReduce总结【阅读.官方文档】

MapReduce

hadoop学习笔记（八）：MapReduce

Hadoop笔记（一） MapReduce介绍

【笔记】Mapreduce数据倾斜与优化

大数据原理笔记——MapReduce

今日推荐

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

周排行

LogN级别的区间查询算法(线段树), 你学会了吗

数论概论(英文版.第4版)

idea 更新后和新的直接安装前，都需要配置 idea64.exe.vmoptions 后再使用

CANOpen系列教程04_CAN总线波特率、位时序、帧类型及格式说明

Java序列化基础

java排序算法整理

异常：org.apache.ibatis.reflection.ReflectionException

（算法练习）——二路归并排序

go 闭包函数

好程序员web前端技术分享媒体查询

每日归档

更多

2024-05-21(8)

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)