大数据的计算模式 - 代码天地

大数据的计算模式

其他 2020-03-09 11:17:31 阅读次数: 0

1. 批处理计算

批量处理无法实现实时计算，可以用Mapreduce和spark。

由于spark是将数据放在内存中计算的，而mapreduce数据在磁盘中，需要将数据从磁盘中读取到内存，算完后再释放回磁盘

因此spark可以实现接近准实时性和秒级的响应

2. 流计算

数据源源不断的放入系统中计算（时间序列的数据），数据特点：少，但是要求响应极快（ms级别）

例如：大型应用系统的故障分析障碍

需要源源不断的从日志中读取，并对日志分析，再做出判断

用啥解决：

storm可以实现

S4，Flume，DStream都可以进行流计算

spark可以

mapreduce是不可以的，他的响应一般是分钟级别的

3. 图计算（有边和结点）

社交网络的数据，谁和谁关系较好等

地理信息的数据，各个城市间的高铁分布等

可以用MApreduce计算，但是效率特别低

google公司开发了专门针对图计算的框架---pregel

Hama、power Graph等也可以进行图计算

4. 查询分析计算

企业中应用最多。对数据仓库中的数据，用sql语句进行查询分析

专门的计算实现：google公司的Dremel

hadoop生态圈的hive

猜你喜欢

转载自www.cnblogs.com/ivyharding/p/12447314.html

大数据的计算模式

大数据典型的计算模式

深入了解大数据计算模式

大数据计算模式有哪些

大数据计算：结构化大数据计算的理想模式

大数据关键技术、及计算模式介绍，以及大数据与云计算、物联网的关系

流式大数据计算实践（1）----Hadoop单机模式

数据的计算（大数据）

大数据计算平台

城市计算与大数据

大数据云计算

大数据计算框架

大数据与云计算

大数据计算引擎

大数据离线计算

Hadoop单机模式的分布式计算框架配置——大数据

云计算需要大数据，大数据需要云计算！

大数据和云计算

云计算与大数据课程×××？

大数据计算技术

云计算与大数据安全

大数据、云计算区别

大数据与云计算的关系

大数据拥抱云计算

大数据------MapReduce 计算流程

大数据计算框架概述

大数据计算系统概述

大数据商业模式

慕课笔记-数据科学导论-第八章大数据与云计算-云计算概念特点/分类/体系架构/大数据与云计算/应用/分布式计算/服务模式/主要技术

大数据数据挖掘与云计算-认识大数据

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)