spark简单介绍 - 代码天地

spark简单介绍

其他 2018-07-11 21:11:08 阅读次数: 0

一，spark历史

诞生于2009年，加州大学伯克利分校RAD实验室的一个研究项目，最初是基于Hadoop Mapreduce 的，

发现Mapreduce在迭代式计算和交互式上低效，引入了内存存储。

2010年3月份spark开源

2011年AMP实验室在spark上开发高级组件，例如：spark Streaming

2013年转移到了Apache下，不就成了顶级项目

二，spark特点

1，spark是快速的： spark扩充了Mapreduce计算模型，spark是基于内存的运算；

2，spark是通用的：spark的设计容纳了其他分布式系统拥有的功能，批处理，迭代式计算，交互查询和流处理等，

优点：降低了维护成本。

三，spark组件

spark包括多个紧密集成的组件

Spark Core:

包含spark的基本功能，包括任务调度，内存管理，容错机制等，

内部定义了RDDs(弹性分布式数据集)

提供了很多APi来创建和操控这些RDDs

为其他组件提供底层的服务

Spark SQL :

spark处理结构化数据的库，就行mysql，hive sql 一样，

企业中用来做报表统计

Spark Streaming:

实时数据流处理组件，类似storm

其提高了api来提供实时流数据

企业主用来从kafka接受数据做实时统计

Mlib:

一个包含通用机器学习功能的包，Machine learning lib,

包含分类，聚类，归类等，还包括模型评估和数据导入，都支持集群横向扩展

Graphx:

图形处理的库，并进行图的并行运算，像spark sql ,spark Streaming 一样，它也继承了RDDs API

提供了各种图的操作，和常用的图算法，例如：PangeRank算法,

应用场景：图计算

Cluster Managers :

集群管理，spark自带一个集群管理是单独调度器，常见的集群管理包括 Hadoop YARN , Apache mesos

猜你喜欢

转载自blog.csdn.net/u014376739/article/details/80755079

spark简单介绍

Spark简单介绍笔记

Spark Sql 简单介绍

Spark GraphX 简单介绍

Spark MLlib 简单介绍

Spark Streaming 简单介绍

Spark原理简单介绍

Spark Streaming介绍以及简单使用

Spark SQL 快速入门系列(1) | Spark SQL 的简单介绍！

Spark Streaming 快速入门系列(1) | Spark Streaming 的简单介绍！

spark运行原理简单介绍和一些总结

Hadoop、storm和Spark Streaming简单介绍（非原创）

Spark SQL 快速入门系列(2) | SparkSession与DataFrame的简单介绍

Spark介绍

35-Spark Streaming反压机制、Spark的数据倾斜的解决和Kylin的简单介绍

Spark介绍（五）Spark MLlib

spark学习(1) : spark介绍

Spark系列（五）Spark-GraphX的基本介绍与算子的简单使用---网络红人排名实例分解

Spark SQL 快速入门系列(3) | DataSet的简单介绍及与DataFrame的交互

Spark的介绍：前世今生

【Spark Streaming介绍】

spark原理介绍

10.2 spark算子介绍

Spark的Shuffle过程介绍

Python Spark的介绍与安装

Apache Spark开发介绍

spark ui介绍

Spark概念介绍

Spark介绍（六）SparkR

Spark介绍（四）SparkSQL

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

循环神经网络（rnn）讲解

Tigao教程四：单独的关节运动

金蝶K3WISE15.0-注册套打教程

如何在Mac上配置Kubernetes

Android应用结束自身进程的方法

SpringMVC学习十三拦截器栈

中国驻洛杉矶总领馆举行新春招待会

HttpClient get post 发送

11 - three.js 笔记 - 绘制三维字体模型

Mysql递归获取某个父节点下面的所有子节点和子节点上的所有父节点

每日归档

更多

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)