大数据——Spark - 代码天地

大数据——Spark

编程语言 2019-10-24 21:02:45 阅读次数: 0

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接： https://blog.csdn.net/qq_39530692/article/details/85008488

Spark产生的原因：

1、MapReduce具有很多的局限性，仅支持Map和Reduce两种操作，还有迭代效率比较低，不适合交互式的处理，不擅长流式处理。

2、现有的各种计算框架各自为战。

Spark就是在一个统一的框架下能够进行批处理，流式计算和交互式计算。

Spark的核心概念就是RDD（弹性分布式数据集）分布在集群中的对象集合，存储在磁盘或内存中。通过并行“转换”操作构造，失效后自动重构。

RDD的两种操作：1、转换：通过Scala集合或者Hadoop构造心得RDD或者通过已有的RDD产生新的RDD

2、行动：通过计算得到一个或一组值

工具：

1、Shark：以Spark为计算引擎的交互式查询引擎，重用了Hive的HQL解析、词法解析、语法解析等模块，与Hive完全兼容，但效率有高于Hive.

2、Graphx：基于Spark图计算的框架，提供图存储结构和图算法。

3、MLBase：基于Spark机器学习库，与Mahout类似，但是是基于Spark实现的，而不是MapRedece，能够实现聚类、分类、推荐等算法、但算法没有Mahout多。

4、Spark Streaming：基于Spark的流式计算框架，充分利用了Spark计算快的优点，吞吐率和效率都高于Storm

Spark最常见的两种应用场景：

1、离线场景：以时间为维度，几年的数据集等，去进行处理。

2、实时场景：实时传输的数据、硬件信号、图像数据并进行计算处理

猜你喜欢

转载自blog.csdn.net/qq_39530692/article/details/85008488

大数据---spark

大数据之spark

大数据--spark

spark大数据的学习

大数据技术——Spark

Python与Spark大数据

Python与Spark大数据！

【大数据】Spark On Yarn

大数据——Spark

大数据-spark

大数据-Spark SQL

大数据-Spark实例

大数据-Spark的RDD

大数据-Spark的HA

大数据-Spark Graphx

大数据-Spark Streaming

【大数据】Spark

【大数据】Spark数据分区

漫谈大数据 - Spark on Hive & Hive on Spark

大数据课上用spark

大数据学习之spark

大数据基础之Spark

大数据：spark集群搭建

大数据(十二)--Spark概述

【大数据】Spark基础解析

【大数据】Spark内核解析

Spark大数据处理

大数据学习——spark笔记

【大数据】【Spark】 Streaming基础

大数据运维Spark

今日推荐

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

周排行

计算机组成与设计（七）—— 除法器

Integer Approximation(分治+枚举)

大话数据库索引

windows10系统JDK的配置及下载地址

mysql实现秒值转换中原六仔平台搭建

Codeforces Round #556 (Div. 1)

百练1064 网线主管

Codeforces 995F Cowmpany Cowmpensation

子集生成之增量构造法，位向量法，二进制法

ERROR: cmd.exe failed with args /c "/APK\gradle\rungradle.bat...

每日归档

更多

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)