Spark一 Spark概念和特征 - 代码天地

Spark一 Spark概念和特征

其他 2018-07-03 01:08:34 阅读次数: 0

Spark是基于内存处理大规模数据的通用快速计算引擎

特征：

1) 快速：速度远超Hadoop计算速度

2) 易使用：提供Java，Python，Scala，SQL等API

3) 通用性：支持交互式查询，流处理，批处理，机器学习算法和图形处理

4) 到处运行：Standalone, Hadoop，Cassandra等数据工具配合使用

Spark Core

1) 实现基本功能，任务调度，内存管理，错误恢复，与存储系统交互

2) 包含RDD的API定义，RDD(resilient distributed dataset)是分布在多个计算机节点上可以并行操作的元素集合，是Spark的主要编程抽象

Spark SQL

1) 操作结构化数据的程序包

2) 通过Spark SQL，可以使用SQL或Hive查询数据

3) 支持多种数据源，Hive，JSON，parquet

4) 支持SQL与RDD编程相结合

Spark Streaming

1) Spark Streaming是Spark提供的对实时数据进行流式计算的组件

2) 提供操作数据流的API，与Spark Core中的RDD API对应

3) 支持容错性，吞吐量，可伸缩性

MLlib

提供常见的机器学习功能的程序库

GraphX

操作图的程序库，可以进行并行的图计算

集群管理器

支持各种集群管理器，包括Hadoop Yarn，Apache Mesos，以及自带的简易调度器，独立调度器

用户

数据科学家和工程师

用途

数据科学任务和数据处理应用

猜你喜欢

转载自blog.csdn.net/weixin_42129080/article/details/80880584

Spark一 Spark概念和特征

Spark 核心概念一

Spark之概念和框架介绍（一）

Spark SQL和特征处理

Spark（一）Spark概述

【Spark】(一) Spark入门

Spark（一）

Spark 概念

Spark 系列（一）—— Spark 简介

Spark 系列（一）—— Spark简介

Spark ML特征的提取、转换和选择

Spark Streaming核心概念一（StreamingContext）

spark理清一些概念

Spark中的一些概念

Spark深入解读（一）---- 基本概念

Spark入门（一）：核心概念简介

【Spark】Spark 基本概念、模块和架构

Spark基础概念01-初识Spark架构和RDD

Spark中的核心概念和任务调度

Spark 的基本概念和操作

Spark源码解析(一):Spark执行流程和脚本

Spark学习（一）--Spark入门介绍和安装

【Spark七十九】Spark RDD API一

Spark运行模式（一）－－－－－Spark独立模式

Spark（一）————Spark介绍以及集群搭建

Spark学习（一）——Spark运行架构

Spark学习笔记：一、Spark简介

Spark学习笔记（一）——Spark编程

[Kafka与Spark集成系列一] Spark入门

spark入门一（spark集群的安装）

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)