SPARK 组成模块 - 代码天地

SPARK 组成模块

其他 2019-08-29 15:01:28 阅读次数: 0

Spark Core
- 实现了Spark的基本功能，包含任务调度、内存管理、错误恢复、与存储系统交互等模块。Spark Core中还包含了对弹性分布式数据集(Resilient Distributed DataSet，简称RDD)的API定义
Spark SQL
- 是Spark用来操作结构化数据的程序包。通过Spark SQL，我们可以使用 SQL或者Hive SQL来查询数据。Spark SQL支持多种数据源，比如Hive表、Parquet以及JSON等
Spark Streaming
- 是Spark提供的对实时数据进行流式计算的组件。提供了用来操作数据流的API，并且与Spark Core中的 RDD API高度对应
Spark MLlib
- 提供常见的机器学习(ML)功能的程序库。包括分类、回归、聚类、协同过滤等，还提供了模型评估、数据导入等额外的支持功能
集群管理器
- Spark 设计为可以高效地在一个计算节点到数千个计算节点之间伸缩计算。为了实现这样的要求，同时获得最大灵活性，Spark支持在各种集群管理器(Cluster Manager)上运行，包括Hadoop YARN、Apache Mesos，以及Spark自带的一个简易调度器，叫作独立调度器（Standalone）

猜你喜欢

转载自www.cnblogs.com/xiangyuguan/p/11429650.html

SPARK 组成模块

spark模块

spark——Shuffle模块详解

九、Spark模块和安装

【Spark102】Spark存储模块BlockManager剖析

【Spark】Spark 基本概念、模块和架构

Spark（五十二）：Spark Scheduler模块之DAGScheduler流程

大数据：hadoop spark，spark特点，功能，架构，模块，角色

FFmpeg的模块组成

Spring框架组成模块

App模块组成

opencv各模块组成

光模块组成

Spark 子模块 Spark Streaming(几张图看懂Spark Streaming框架)

Spark读HBase多表组成一个RDD

spark.ml机器学习模块

Spark Streaming 实现思路与模块概述

Spark2.1.0之模块设计

白话Spark——Executor模块与RDD详解

spark 调度模块详解及源码分析

Spark 子模块 SparkSQL 的缓存管理分析

Spark Core 子模块 Shuffle 分析

Spark Core 子模块 storage分析

Spark 子模块 StructuredStreaming分析(及SparkSQL的演变)

SparkSQL---Spark计算引擎模块

spark

spark：

【spark】

大数据之Spark（五）--- Spark的SQL模块，Spark的JDBC实现，SparkSQL整合MySQL，SparkSQL整合Hive和Beeline

spark学习笔记__chap4_spark基础原理__1_模块介绍

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)