实时计算、离线计算、流式计算、批量计算之间的关系 - 代码天地

实时计算、离线计算、流式计算、批量计算之间的关系

其他 2018-08-11 20:16:16 阅读次数: 0

批量和流式的区别：

1.数据处理单位：

批量计算按数据块来处理数据，每一个task接收一定大小的数据块，比如MR，map任务在处理完一个完整的数据块后（比如128M），然后将中间数据发送给reduce任务。

流式计算的上游算子处理完一条数据后，会立马发送给下游算子，所以一条数据从进入流式系统到输出结果的时间间隔较短（当然有的流式系统为了保证吞吐，也会对数据做buffer）。

这样的结果就是：批量计算往往得等任务全部跑完之后才能得到结果，而流式计算则可以实时获取最新的计算结果。

离线=批量？实时=流式？

习惯上我们认为离线和批量等价；实时和流式等价，但其实这种观点并不完全正确。

假设一种情况：

当我们拥有一个非常强大的硬件系统，可以毫秒级的处理Gb级别的数据，那么批量计算也可以毫秒级得到统计结果（当然这种情况非常极端，目前不可能），那我们还能说它是离线计算吗？

所以说

离线和实时应该指的是：数据处理的延迟；
批量和流式指的是：数据处理的方式。
两者并没有必然的关系。事实上Spark streaming就是采用小批量（batch）的方式来实现实时计算。

Ref: 实时计算——聊一聊我所经历的计算框架

猜你喜欢

转载自blog.csdn.net/byamao1/article/details/80152950

实时计算、离线计算、流式计算、批量计算之间的关系

流式计算和批量计算

离线计算,实时计算和流式计算的概念区分

离线计算与实时计算

锂离子电池电压与容量的关系及容量计算方法

云计算和大数据之间关系

bitlocker和可信计算之间的关系

大数据与云计算之间的关系是怎样的？

hadoop离线计算与 storm实时计算

并发量计算

【Python】批量计算文件哈希

MySQL 坐标批量计算及优化

mysql 三角测量计算地球表面两点之间的距离

使用向量计算三角形面积和点与直线的位置关系

批量计算和流计算简单比对

区块链和云计算之间有何关系？

各种计算机硬件之间的关系

什么是雾计算，与物联网之间有什么关系？

云计算和大数据之间的关系是什么？

计算机中原码，反码，补码之间的关系

云计算、大数据、人工智能之间的关系，总章

边缘计算和ARM之间存在着哪些关系

oracle 内存和sga，pga之间计算关系

Twitter Storm流式计算（实时计算）框架简介一

网站并发量计算

理论容量计算

磁盘容量计算

增量计算方差

矢量计算vec

cockroach矢量计算

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

NEFU 117 素数个数的位数

Closest Common Ancestors (Lca,tarjan)

ELK部署

【转载】Hive笔记整理（三）

SQL语句（一）基本表的定义

关于Java web开发中的MySQL的事务语句

MFC创建自定义窗体

如何用一句话激怒程序员？

《逆袭大学》文摘——9.4 基础和应用的平衡中找到大学的节奏

【spring源码分析】@Value注解原理

每日归档

更多

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)