Spark原理和使用场景的简述 - 代码天地

Spark原理和使用场景的简述

企业开发 2018-05-13 01:17:31 阅读次数: 0

今天老大谈到了Spark，说是计算速度比hadoop MapReduce快100倍,顿时惊讶，于是乎埋头google,主要想弄清楚两个问题 1 Spark怎么会那么快 2 Spark的适用场景。苦苦搜索，总得结果。
spark是对MapReduce计算模型的改进，可以说没有HDFS，MapReduce，就没有spark.尽管spark官网很少提到MapReduce.
Spark可用于迭代，主要思想是内存计算，即将数据存到内存中，以提高迭代效率。
（我认为就是通过缓存数据的方式减少IO的消耗，从而提高了性能）
Spark可以将过程数据存在内存中（从文件中读取，或经过map处理的数据），方便其他模块重复调用。
相比hadoop MapReduce 主要的改进：
1迭代运算，一次创建数据集。多次使用，减少了IO的开销。
2允许多种计算模型（包含map-reduce）
3 支持非OO式算法实现，对机器学习算法，图计算能力有很好的支持。

仔细研读下面的文章，就能理解我的总结
迭代式MapReduce框架介绍
http://dongxicheng.org/mapreduce/iterative-mapreduce-intro/
传统MapReduce框架
http://dongxicheng.org/mapreduce/traditional-mapreduce-framework/
选择Spark on Yarn的三个理由
[url] http://storage.it168.com/a2013/1123/1564/000001564111.shtml[/url]
注：迭代运算：这里指对同一个数据集的多次使用

猜你喜欢

转载自chenchangqun.iteye.com/blog/2024984

Spark原理和使用场景的简述

Redis特性和使用场景简述

Spark SQL和Hive使用场景？

简述final的使用场景

Dubbo Filter原理和使用场景

RemoteViews使用场景和工作原理

volatile的原理和使用场景

exists 和 in 的执行原理及使用场景

ThreadLocal的原理和使用场景

nextTick 使用场景和原理？

WebSocket原理及使用场景

ThreadLocal使用场景，原理

简述 TCP 和 UDP 的区别以及优缺点和使用场景?

Jetty Continuation实现原理和使用场景分析

Java SPI机制原理和使用场景

zookeeper1：原理和使用场景

【java】ThreadLocal线程变量的实现原理和使用场景

Hbase原理的介绍和使用场景分析

聊聊面试中的 ThreadLocal 原理和使用场景

面试中的 ThreadLocal 原理和使用场景

Dockerfile 多阶段构建原理和使用场景

常用线程池的工作原理和使用场景

【并发编程】Volatile原理和使用场景解析【并发编程】Volatile原理和使用场景解析

简述Java数组与链式列表的区别以及使用场景

16种python设计模式使用场景、特点简述

简述lvs三种集群优点及使用场景

简述 gevent模块的作用和应用场景。

简述 asynio模块的作用和应用场景。

【Spark八十三】BlockManager在Spark中的使用场景

mongodb 使用场景和不使用场景

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)