大数据仓库－增量更新 - 代码天地

大数据仓库－增量更新

数据库 2018-05-10 05:36:06 阅读次数: 0

2015-12-03 朱洁 hadoop技术学习

现在是国内凌晨3点，为了抵挡睡意，还是写写技术博客。今天和大家讨论下大数据仓库中的更新技术。

当前很多大数据技术，如HDFS最早设定的是数据不更新，只增量叠加。传统数据仓库（Greenplum,treadata,oracle RAC）通常碰到两个问题：

1、更新的throughput不高。主要影响原因有两点，锁的原因，还有更新通常是随机IO，很难充分利用硬盘高吞吐的优势。

2、更新影响查询。更新把IO占住，查询的体验急剧下降。

为了解决这个问题，Google的Mesa系统设计了一个MVCC的数据模型，通过增量更新和合并技术。将离散的更新IO转变成批量IO，平衡了查询和更新的冲突，提高了更新的吞吐量。

Mesa设计了一个多版本管理技术来解决更新的问题：

1、使用二维表来管理数据，每个表要制定schma，类似传统数据库。

2、每个字段用KeyValue来管理。Schema就是是key的集合，指向value的集合。

3、每个字段指定一个聚合函数F。（最常见的是SUM）

4、数据更新进来的时候，按照MVCC增量更新，并给增量更新指定一个版本号N，和谓词P。

5、查询进来的时候，自动识别聚合函数，把所有版本的更新按照聚合函数自动计算出来。

6、多版本如果永远不合并，存储的代价会非常大，而且因为每次查询需要遍历所有版本号，所以版本过多会影响查询，因此定期的合并是自然而然的。

7、Mesa采用两段更新的策略。更新数据按版本号实时写入，每十个版本自动合并，每天又全量合并一遍，合并成一个基础版本。

好了，今天主要就介绍Mesa的数据模型。Mesa的论文中举了一个例子更方便理解，大家去看看吧。

微信扫一扫
关注该公众号

猜你喜欢

转载自jiezhu2007.iteye.com/blog/2265152

大数据仓库－增量更新

大数据-数据仓库：全量表，增量表，拉链表，流水表，快照表

大数据-数据仓库

大数据仓库－kudu

基于大数据的数据仓库-数据仓库的概念

大数据数据仓库－场景

大数据数据仓库－概念

［大数据］数据仓库好文分享

大数据 Hive数据仓库

浅谈数据仓库和大数据

数据仓库到大数据

大数据体系构建数据仓库

大数据之数据仓库

大数据06 数据仓库 Hive

[大数据]数据仓库的搭建

基于大数据的数据仓库

大数据----数据仓库架构

大数据开发之数据仓库

大数据——Hive(数据仓库工具)

大数据 Hive 数据仓库介绍

数据仓库实践杂谈（九）——增量/全量

大数据仓库hive初识简介

【Hive】基于hadoop的大数据仓库

大数据之路（一）-数据仓库也需要大数据

大数据数据仓库-独一无二的数据仓库建模指

基于大数据的数据仓库-数据仓库建模基本理论

数据库与大数据(数据仓库)的区别

一般数据库增量数据处理和数据仓库增量数据处理的几种策略

大数据系列4：Hive – 基于HADOOP的数据仓库

详解大数据数据仓库分层架构

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)