大数据介绍-spark

其他 2020-04-24 23:57:30 阅读次数: 0

1、Hadoop

　　MapReduce，大数据计算框架,map将数据写入磁盘，然后分发到reduce。只适合处理对处理速度不敏感的大数据计算任务。基于磁盘，大量网络传输。处理过程太死板，必须shuffle

　　HDFS，大数据存储系统

　　Hive，SQL，大数据查询框架/计算框架

　　HBase，NOSQL，实时/准实时查询，存储查询系统

　　YARN，资源调度

客户端，J2EE开发的一些数据系统，包含HQL的shell脚本，

2、Spark，大数据计算框架。执行操作时，各种操作都在内存。比mapreduce和hive快几十倍。

　　HDFS,大数据离线计算和批处理

　　Hive，

　　Spark Core离线计算

　　Spark SQL交互式查询

　　Spark Stream实时流计算

　　Spark MLlib机器学习

　　Spark Graphx图计算

　　Spark RDD

　　Spark Engine

　　Yarn，Mesos，AWS

　　HDFS，S3，Cassandra

3、storm

猜你喜欢

转载自www.cnblogs.com/xiaofeiyang/p/12770745.html

大数据介绍-spark

大数据介绍

大数据介绍详情

工业大数据介绍

大数据介绍及大数据项目流程

大数据教程【01.01】--大数据介绍及开发环境

DKhadoop大数据处理平台监控数据介绍

云计算与大数据介绍（非原创）

大数据介绍和集群安装--hadoop

元数据介绍

MODIS数据介绍

POI数据介绍

NCEP数据介绍

运营商大数据，运营商大数据介绍

sql查询数据介绍

Landsat 8数据介绍

Fidder教程-数据介绍

ICESat数据介绍及下载

表结构数据介绍

遥感数据介绍—MODIS

MODIS数据介绍及下载

数据仓库元数据介绍

CRM产品主数据介绍

Landsat卫星数据介绍及下载方法

章节四： RASA 训练数据介绍

大数据项目之电商数仓、业务数据介绍、MySQL安装、更改MySQL密码策略

大数据项目之电商数仓、业务数据介绍、电商系统表结构

大数据12_Spark MLlib介绍

Hadoop与Spark等大数据框架介绍

大数据-Spark的介绍：前世今生

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)