【Spark】快速简介 - 代码天地

【Spark】快速简介

其他 2018-12-05 16:00:58 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/u011240016/article/details/84337831

两个要点：

快速通用的计算机系统集群，用于大规模数据处理
高层API可用Java，Scala，Python以及R

Spark上的库：

Spark SQL: 数据库操作
Spark Streaming: 流计算
MLlib: 机器学习库
GraphX: 图计算
SparkR

Spark的语义抽象/概念

RDD: Resilient Distributed Dataset，弹性分布式数据库
DAG: 有向无环图
SparkContext
Transformations
Actions

这些概念后面陆续展开。

大数据解决方案

包含多个重要组件：

硬件层：
- 存储
- 计算
- 网络
数据引擎：大脑
统计、计算算法
数据可视化（分析层）

Spark起源

2009年，Matei在进行博士研究时创立，基于内存的基本类型，可以为应用程序带来100倍的性能提升。用户可以将数据加载到集群内存用来反复查询，非常适用于大数据和机器学习。

Spark只是一个通用计算框架，利用Spark实现的应用才是其真正价值所在。

Spark的三个优点

易用，高层API剥离了对集群的关注，可以专注于计算本身
快，且支持交互式使用和复杂算法
通用，Spark是通用引擎，可以完成各种各样的计算
- SQL查询
- 文本处理
- 机器学习

学习Spark，只有一台电脑也是可以的。

学习目标：

搭建Spark集群
使用Spark Shell
编写Spark应用解决并行问题

END.

参考：
https://www.youtube.com/watch?v=TgiBvKcGL24&list=PLbk_EDDIZpfYHlJ_mnyWFgt1CeTPZXXTD

https://github.com/databricks/learning-spark

猜你喜欢

转载自blog.csdn.net/u011240016/article/details/84337831

【Spark】快速简介

Mybatis的快速简单入门

企业—MemCache缓存加速简介

快速简单高效的搭建 SolrCloud 集群

Go语言快速简单入门（三）

Go语言快速简单入门（二）

Go 语言快速简单入门（一）

PHP 超快速简易的配置安装

FBX SDK快速简笔（基本）

Socket快速简要了解

PyTorch - 02 - PyTorch安装-快速简便

SpringBoot如何快速简化部署

快速简单：轻松计算物体距离

PS如何快速简单的给人像美白

实现一个快速简单的SimpleListDialog<T>

php函数快速简单截取中英文

ubuntu中快速简单统计代码行数信息

bzoj1956（一个快速简单的方法)

opecv jni android c++快速简单教程

利用Maya快速简便建立山脉模型

Linux虚拟机快速简单配置VPN

SpringBoot2快速简单整合Dubbo

对文件进行快速简单加密（防小白）

Hexo 4.0.0 发布，快速简洁且高效的博客框架

#码云操作（如何快速简单掌握码云）

Hexo 4.1.0 发布，快速简洁且高效的博客框架

Hexo 4.2.0 发布，快速简洁且高效的博客框架

Hexo 4.1.1 发布，快速简洁且高效的博客框架

GitHub快速简单入门级搜索

快速简单搞懂归并排序【新手推荐】

今日推荐

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

周排行

rbac——界面、权限

Apache CXF + SpringMVC 整合发布WebService

so插件化

Vue.js实战系列---图标字体制作（svg格式）

PAT乙级 1007 素数对猜想(孪生素数对) (20分) ---（C语言 + 详细注释）

被IRM保护的文档，打开失败

Calendar和Date计算日期差的小问题

win10子系统ubuntu18.4安装docker

利用Wrap Shell Script定位Android Native内存泄漏

MySQL: Transaction (Part I - Basic Concept)

每日归档

更多

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)