SPARK快学大数据分析概要 - 代码天地

SPARK快学大数据分析概要

其他 2018-06-21 11:09:47 阅读次数: 3

Spark 是一个用来实现快速而通用的集群计算的平台。在速度方面，Spark 扩展了广泛使用的MapReduce 计算模型，而且高效地支持更多计算模式，包括交互式查询和流处理。在处理大规模数据集时，速度是非常重要的。Spark 的一个主要特点就是能够在内存中进行计算，因而更快。不过即使是必须在磁盘上进行的复杂计算，Spark 依然比MapReduce 更加高效。

总的来说，Spark 适用于各种各样原先需要多种不同的分布式平台的场景，包括批处理、迭代算法、交互式查询、流处理。通过在一个统一的框架下支持这些不同的计算，Spark使我们可以简单而低耗地把各种处理流程整合在一起。而这样的组合，在实际的数据分析过程中是很有意义的。

Spark 所提供的接口非常丰富。除了提供基于Python、Java、Scala 和SQL 的简单易用的API 以及内建的丰富的程序库以外，Spark 还能和其他大数据工具密切配合使用。例如，Spark 可以运行在Hadoop 集群上，访问包括Cassandra 在内的任意Hadoop 数据源。

猜你喜欢

转载自www.cnblogs.com/playforever/p/9207766.html

SPARK快学大数据分析概要

数据分析——概要

spark快速大数据分析（4）

spark快速大数据分析（3）

spark快速大数据分析（2）

spark快速大数据分析

基于Pycharm的Spark大数据分析

Spark---大数据分析引擎

浅析spark快速大数据分析

大数据分析要学什么

跟我一起学Spark之——《Spark快速大数据分析》pdf版下载

[Spark快速大数据分析]Spark基础

【大数据平台】基于Spark的气象数据分析

什么是大数据分析？大数据分析要学什么？

Spark大数据分析实战 PDF 扫描版

Python3实战Spark大数据分析及调度

spark快速大数据分析笔记-2

《Spark大数据分析实战》PDF版

《Spark快速大数据分析》PDF版

基于PySpark大数据分析/Python/Spark

spark快速大数据分析学习笔记（1）

大数据分析技术与实战之 Spark Streaming

Spark快速大数据分析——机器学习

《Spark快速大数据分析》总结--（3）

《Spark快速大数据分析》总结--（2）

《Spark快速大数据分析》总结--（1）

.NET for Apache® Spark™ 开源大数据分析工具

Python3实战spark大数据分析及调度 ☝☝☝

Flume+Kafka+Spark Streaming 大数据分析处理

spark 数据分析

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

循环神经网络（rnn）讲解

Tigao教程四：单独的关节运动

金蝶K3WISE15.0-注册套打教程

如何在Mac上配置Kubernetes

Android应用结束自身进程的方法

SpringMVC学习十三拦截器栈

中国驻洛杉矶总领馆举行新春招待会

HttpClient get post 发送

11 - three.js 笔记 - 绘制三维字体模型

Mysql递归获取某个父节点下面的所有子节点和子节点上的所有父节点

每日归档

更多

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)