为什么选择spark - 代码天地

为什么选择spark

其他 2019-01-06 10:50:57 阅读次数: 0

原因

随着互联网规模的爆发式增长，不断增加的数据量要求应用程序能够延伸到更大的集群中去计算。
与单台机器计算不同，集群计算引发了几个关键问题，如
集群计算资源的共享
单点宕机（单点死机的意思）
节点执行缓慢
程序的并行化。针对这几个集群环境的问题，许多大数据处理框架应运而生。
比如Google的MapReduce，它提出了简单、通用并具有自动容错功能的批处理计算模型。但是MapReduce对于某些类型的计算并不适合，比如
交互式（对话的方式一问一答，相互的那种）
流式计算（对数据流进行实时计算）
在这里插入图片描述
基于这种类型需求的不一致性，大量不同于MapReduce的专门数据处理模型诞生了，如GraphLab、Impala、Storm等。大量数据模型的产生，引发的后果是对于大数据处理而言，针对不同类型的计算，通常需要一系列不同的处理框架才能完成。这些不同的处理框架由于天生的差异又带来了一系列问题：
重复计算、
使用范围的局限性、
资源分配、
统一管理
又出现了这些问题，spark诞生了
要注意这些问题，不同的时间段出现不同的问题，有不同的解决方法

猜你喜欢

转载自blog.csdn.net/qq_43688472/article/details/85866000

为什么选择spark

大数据为什么要选择Spark

Spark入门——什么是Hadoop，为什么是Spark?

为什么选择nginx

为什么选择Memcache

为什么选择react

为什么选择Python

为什么选择.NETCore？

为什么选择MongoDB

为什么选择Qt？

为什么选择PaaS

为什么选择RocketMQ

为什么选择.NETCore

为什么选择AJPFX

为什么选择Bootstrap

为什么选择Cassandra

为什么选择Linux

为什么选择python？

为什么选择flutter

为什么我们生产上要选择Spark On Yarn模式？

Spark 为什么比Hadoop快

Spark为什么比Hadoop快？

Spark为什么比Hadoop好？

【Spark系列】：Spark为什么比Hadoop快

为什么选择Angular 2？

【TypeScript】为什么选择 TypeScript

为什么要选择Hibernate

为什么要选择Redis

我为什么选择Vim

为什么选择ABP框架

今日推荐

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

“百模大战”必有一战 | 2024中国“百模大战”竞争格局分析

周排行

Family Tree 题解

BZOJ 1093 最大半连通子图 SCC + DP

幂等处理

Spring----学习（2）----XML 配置Bean 自动装配

SQL Server 远程更新目标表数据

HIbernate3.6 环境搭建

特殊符号正则表达式

【Linux】第一章进程的理解

843. n-皇后问题（dfs+输出各种情况）

空间数据库2

每日归档

更多

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)

2024-04-17(5)