The Snowflake Elastic Data Warehouse - 代码天地

The Snowflake Elastic Data Warehouse

其他 2019-12-09 14:34:10 阅读次数: 0

开篇说的是，Shared-nothing当前已经是主流的架构，需要用自身的local disks来存储数据，Tables被水平划分到各个partitions上

这种架构，比较适合star-schema，即事实表外只有一层维表，这样join会比较简单，可以把维表广播，避免大量的数据传输

这个架构的主要问题就是，计算和存储没有分离

带来的问题，他说了几点，我的理解主要是，

首先资源利用会不合理，因为存储和计算任意资源不足，都需要增加节点，而且各个节点上很容易产生热点，热点打散比较麻烦，因为需要分割数据

最关键的是，这个架构在每个node上都有状态，存在本地磁盘，需要保证一致性

扩缩容非常的麻烦，有可能需要迁移数据和分割数据，这个成本非常的高

这篇文章的主要的思想，就是做了计算和存储分离

数据直接放到S3上，

那么本地磁盘仅仅用于cache

Snowflake整体的架构分3层，

Data Strorage

数据主存储用的是S3，会有更高的延迟，更大cpu消耗，尤其是用https的时候

而且S3是对象存储，无法append，当然读的时候是可以读部分数据

Compared to local storage, S3 naturally has a much higher access latency and there is a higher CPU overhead associated with every single I/O request, especially if HTTPS connections are used.

But more importantly, S3 is a blob store with a relatively simple HTTP(S)-based PUT/GET/DELETE interface. Objects i.e. les can only be (over-)written in full. It is not even possible to append data to the end of a le.

In fact, the exact size of a le needs to be announced up-front in the PUT request. S3 does, however, support GET requests for parts (ranges) of a le.

Snowflake把table分成large immutable files，列存格式，高压缩，有header

但没解释如何解决append的问题，高延迟的问题

S3还会作为临时存储放中间结果

Meta是放在KV里面，这部分属于管控

Virtual Warehouses

计算节点，因为存储分离出去了，所以这里纯粹的计算节点

用EC2组成cluster，作为一个VW，用户只能感知到VW，不知道底下有多少ec2的worker node

这里为了便于用户理解，规格直接用类似T-shirt的，X，XXL，很形象

VM是无状态的，纯计算资源

所以这样设计就很简单了，快速扩缩容，failover

用户可以有多个VM，但是底下针对一个相同的存储，VM之间资源是隔离的，所以可以做到不同的query间不干扰

Worker只有在真正查询的时候，才会启动查询进程

为了降低读取S3的延时，在本地磁盘对读取过的文件做了cache，会cache header和读取过的column的数据，这里就采用的比较简单LRU策略

为了让cache更有效，要保证需要读取相同数据的query被分发到相同的worker node，所以这里采用一致性hash来分发query

这里一致性hash是lazy的，意思就是不会搬数据，因为本身cache，所以无所谓，变了就重新建cache，老的等LRU过期

由于Worker是纯计算节点，数据都在S3，所以他处理skew，数据倾斜问题就非常简单，我做完了，可以帮peer做他没有做完的；如果是share-nothing就比较麻烦了，数据倾斜是很讨厌的问题

ExecutionEngine
高效的执行引擎，

基于Columnar，可以更好的利用CPU和SIMD

向量化，不会物化中间结果，采用pipiline的方式，参考MonetDB的设计

Push，operator间通过push，streaming的方式

Cloud Services

管控服务，

多租户共用，每个service都是长生命周期和shared，保证高可用和可扩展

查询管理和优化

所有查询都需要通过CloudService，并会在这完成parsing，optimization的阶段
这里优化用的是Top-down Cascades的方式

由于Snowflake没有index，而且把一些优化放到了执行阶段，比如join数据的分布，所以搜索空间大大降低，同时提升了优化的稳定性
其实说白了，弱化了查询优化部分，把部分工作放到执行引擎中

然后后面就是典型的MPP的过程，把执行计划下发到各个workers，并监控和统计执行状况

并发控制

通过Snapshot Isolation来实现事务机制
这里SI是通过MVCC实现的，这是一个自然的选择，对于S3只能整个替换files，每个table version对应于哪些file，由在kv中的metadata管理

传统的数据库，通过索引来检索数据，这里说索引的问题，比如随机读写，overload重，需要显式创建

所以对于AP场景，一般不会选择建B tree这样的索引，而选择顺序扫描数据，所以才有pruning的问题
如果要高效的pruning，需要知道这块数据到底需不需要扫描，是否可以跳过，所以会在header中加上很多的统计，min，max等

4. Feature Highlights

Pure Software-as-a-Service Experience

Continuous Availability，存储和计算分离后，数据的一致性交给S3来保证，只需要保证无状态的计算节点的高可用，没有什么好说的

Semi-Structured and Schema-Less Data

Time Travel and Cloning，由于mvcc，旧版本不删除，自然就支持Time Travel

Security

这篇论文，除了给出计算和存储分离的架构，没有特别的创新的地方，其他的技术都是common sense，在计算和存储分离部分的细节也没有详细描述

猜你喜欢

转载自www.cnblogs.com/fxjwind/p/12010698.html

The Snowflake Elastic Data Warehouse

data warehouse models

Concept of Key in Data Warehouse

Data Lake VS Data Warehouse

Data Warehouse 业务系统不入仓表

Streaming Data Warehouse 存储：需求与架构

2017 ES GZ Meetup分享：Data Warehouse with ElasticSearch in Datastory

通过SQL*Plus连接到Oracle Autonomous Data Warehouse

snowflake

基于spring data的Elastic Search的配置示例

COMP9318 2020T1 Data Warehouse Week2

elastic

Elastic实战：spring-data-elasticsearch聚合查询指南

Azure SQL 数据库仓库Data Warehouse (2) 架构 Windows Azure Platform 系列文章目录

Azure SQL 数据库仓库Data Warehouse (3) DWU Windows Azure Platform 系列文章目录

Azure SQL 数据库仓库Data Warehouse (4) 2018 TechSummit 动手实验营 Windows Azure Platform 系列文章目录

《Building the Data Warehouse》（数据仓库第四版）拆书稿-关系模型（3NF范式建模）重要知识点

Twitter Snowflake

Snowflake算法

SnowFlake学习

process of warehouse design

Robots at Warehouse【dfs/bfs】

CWM(Common warehouse metamodel)

Poor Warehouse Keeper

ABAP术语-BW (Business Information Warehouse) BW (Business Information Warehouse)

关于 SAP Extended Warehouse Management 的 higher level warehouse order

gym 100971 J Robots at Warehouse

android studio Warehouse(仓库配置)

Elastic实战：彻底解决spring-data-elasticsearch日期、时间类型数据读取报错问题

Snowflake(雪花算法)

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)