Beam-介绍

其他 2020-04-15 11:21:07 阅读次数: 0

简介

Beam提供了一套统一的API来处理两种数据处理模式（批和流），让我们只需要将注意力专注于在数据处理的算法上，而不用再花时间去对两种数据处理模式上的差异进行维护。

Beam每6周更新一个小版本。

编程模型

第一层是现有各大数据处理平台（spark或者flink）,在Beam中它们也被称为Runner。
第二层，是可移植的统一模型层，各个Runners将会依据中间抽象出来的这个模型思想，提供一套符合这个模型APLs出来，以供上层转换。
第三层，是SDK层。SDK层将会给工程师提供不同语言版本的API来编写数据处理逻辑，这些逻辑就会被转化Runner中相应API来运行。
第四层，是可扩展库层。工程师可以根据已有的BeamSDK，贡献分享出更多的新开发者SDK,IO连接器，转换操作库等等。
第五层，我们可以看作是应用层，各种应用将会通过下层的BeamSDK或工程师贡献的开发者SDK来实现。
第六层，社区。

窗口将无边界数据根据事件时间分成一个个有限数据集。我们可以看看批处理这个特例。在批处理中，我们其实是把一个无穷小到无穷大的时间窗口赋予了数据集。

水印是用来表示与数据事件时间相关联的输入完整性的概念。对于事件时间X的水印是指：数据处理逻辑已经得到了所有时间小于X的无边界数据。在数据处理中，水印是用来测量数据进度的。

触发器指的是表示在具体什么时候，数

猜你喜欢

转载自blog.csdn.net/qq_19968255/article/details/96158013

Beam-介绍

Beam-链路顺序

Beam系列一 Beam介绍及简单使用.md

Beam Search

Beam程序

beam 追踪

beam Selection

Beam技术

Apache Beam 剖析

Greedy search与beam search

Beam Cannon HDU - 5091

Beam学习笔记

Apache Beam官方文档

Beam分词计数.md

beam search实现

Beam me out!

Beam中的join

Bminer 的 Beam挖矿教程

Apache Beam是什么？

集束搜索（beam search）

Apache Beam 模型

Apache Beam -- 简介

10.10_beam-search

波束管理 Beam Management

beam_search

Beam Search学习

大模型加载的参数介绍及推荐表，temperature、top_k、top_p、num_beams、num_beam_groups、do_sample等

erlang beam文件反编译

Beam从零开始（一）

Apache Beam开发指南

今日推荐

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

周排行

rbac——界面、权限

Apache CXF + SpringMVC 整合发布WebService

so插件化

Vue.js实战系列---图标字体制作（svg格式）

PAT乙级 1007 素数对猜想(孪生素数对) (20分) ---（C语言 + 详细注释）

被IRM保护的文档，打开失败

Calendar和Date计算日期差的小问题

win10子系统ubuntu18.4安装docker

利用Wrap Shell Script定位Android Native内存泄漏

MySQL: Transaction (Part I - Basic Concept)

每日归档

更多

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)