spark子框架汇总 - 代码天地

spark子框架汇总

编程语言 2018-11-30 12:54:48 阅读次数: 0

SQL 实时数据流处理机器学习图计算 4大子框架

1图计算GraphX,下面是一栈式解决GraphX和GraphLab的对比相比之下虽然GraphX没有GraphLab快但一栈式解决让整体更好

图存储模式：巨型图的存储有边分割（每个顶点都存储一次，但边可能被分到不同的机器，如果基于边的计算，那么跨机器通信变大）和点分割（边只存储一次）

2实时流处理框架spark streaming

spark streaming把输入数据按照batch size分成一段一段的discretized stream（DStream），每一段数据都转换成spark中的RDD

3交互式SQL处理框架 spark SQL

有如下特点:

1 能在Scala代码里写SQL 2 支持parquet文件(列式存储格式的文件系统，使用parquent文件进行读写，可以极大的降低对于cup和磁盘I/O的消耗)的读写，且保留scheme 3支持直接多json格式数据操作 4 能在Scala代码里访问hive元数据，能执行hive语句，并且把结果返回作为rdd

4机器学习框架spark MLlib （机器学习算法库，同时包含相关的测试和数据生成器，支持二元分类·回归·聚类·协同过滤）

猜你喜欢

转载自blog.csdn.net/IT_NEU_Lee/article/details/84580053

spark子框架汇总

spark异常汇总

hive on spark问题汇总

Spark编程汇总

spark mllib问题汇总

Spark问题出错汇总

Spark Streaming异常 -- 汇总

Spark面试汇总

运行spark报错汇总

Spark 异常汇总（持续更新）

SPARK 学习资源汇总（1）

Spark：遇到问题汇总

Spark Streaming 技术点汇总

hive与spark的匹配版本汇总

Spark常用算子汇总（转载）

Spark几个重要的端口汇总

Spark 常用Shuffle算子汇总

spark shell的运行模式汇总

spark dataframe笔记（链接汇总）

spark shell的运行模式汇总

Pandas和Spark知识汇总

SPARK知识点汇总

spark开发问题汇总

Docker子命令汇总与解析

子图绘制方法汇总

Spark的那些外部框架

Spark框架核心概念

Spark框架详解

Spark处理框架

spark计算框架

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

循环神经网络（rnn）讲解

Tigao教程四：单独的关节运动

金蝶K3WISE15.0-注册套打教程

如何在Mac上配置Kubernetes

Android应用结束自身进程的方法

SpringMVC学习十三拦截器栈

中国驻洛杉矶总领馆举行新春招待会

HttpClient get post 发送

11 - three.js 笔记 - 绘制三维字体模型

Mysql递归获取某个父节点下面的所有子节点和子节点上的所有父节点

每日归档

更多

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)