Spark的基本介绍 - 代码天地

Spark的基本介绍

其他 2020-04-08 10:37:32 阅读次数: 0

Spark
1、什么是Spark
是基于内存的用于大规模数据处理(离线计算、实时计算、快速查询)的统一分析引擎。
也是一个生态系统。
2、官网
http://spark.apache.org
http://spark.apachecn.org
在这里插入图片描述
3、Spark特点
1）、速度快
比MapReduce块10-100倍
2）、易用（算法多）
MR只支持一种计算算法，Spark支持多种算法。
3）、通用
Spark可以支持离线计算、实时计算、快速查询（交互式）、机器学习、图计算
4）、兼容性强
支持大数据中现有的Yarn. Mesos等多种调度平台，可以处理hadoop支持的数据。
4、Spark发展史
2009 年诞生于加州大学伯克利分校AMP 实验室
2014年成为 Apache 的顶级项目
5、Spark为什么会流行
原因1：优秀的数据模型和计算抽
支持多种计算模型，而且基于内存（内存比硬盘速度快）
RDD 是一个可以容错且并行的数据结构
原因2：完善的生态圈（Spark生态圈）
在这里插入图片描述
Spark Core：实现Spark 基本功能（RDD）
SparK SQL: 操作结构化数据
Spark Streaming : 对实时数据进行流式计算
Spark MLlib : 机器学习(ML)功能
GraphX(图计算) : 用于图计算的API
6、Hadoop 对比Spark

7、Spark运行模式
1.local本地模式(单机)–开发测试使用
2.standalone独立集群模式–开发测试使用
3.standalone-HA高可用模式–生产环境使用
4.on yarn集群模式--生产环境使用
5.on mesos集群模式–国内使用较少
6.on cloud集群模式–中小公司未来会更多的使用云服务

发布了213 篇原创文章 · 获赞 406 · 访问量 24万+

私信关注

猜你喜欢

转载自blog.csdn.net/qq_45765882/article/details/105358465

Spark的基本介绍

Spark SQL：基本介绍(特点)

spark sql基本使用方法介绍

Spark Streaming笔记整理（一）：基本工作原理介绍

Spark介绍

【Spark】Spark基本操作

Spark介绍（五）Spark MLlib

spark学习(1) : spark介绍

Spark系列（五）Spark-GraphX的基本介绍与算子的简单使用---网络红人排名实例分解

介绍 Apache Spark 的基本概念和在大数据分析中的应用。

Spark的介绍：前世今生

【Spark Streaming介绍】

spark原理介绍

spark简单介绍

10.2 spark算子介绍

Spark的Shuffle过程介绍

Python Spark的介绍与安装

Apache Spark开发介绍

Spark概念介绍

1.Spark介绍

spark ui介绍

Spark简单介绍笔记

Spark介绍（六）SparkR

Spark介绍（四）SparkSQL

Spark介绍（三）SparkStreaming

Spark介绍（二）RDD

Spark介绍（一）简介

Spark中的角色介绍

Spark-介绍

Spark Sql 简单介绍

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)