数据库优化技术之向量化计算和编译执行

其他 2021-03-30 21:47:47 阅读次数: 0

0 介绍

最近开始接触一个战斗民族开发的列式数据库ClickHouse，它是一个高性能的OLAP，根据一些测试，它的查询效率达到mysql的数十到数百倍。那么至于它的性能为何如此之高，一个很重要的优化就是它实现了向量化计算和编译执行，这里介绍几篇文章解释这两个优化操作。

1 火山模型

在谈优化之前，不妨先读一下这篇文章火山模型介绍。火山模型的缺点在于每次都是计算一个 tuple（Tuple-at-a-time），这样会造成多次operator节点调用 next ，也就是造成大量的虚函数调用，这样会造成 CPU 的利用率不高。

2 向量化计算和编译执行

这篇文章向量化与编译执行浅析讲的很好。
火山模型是一个拉取模型，编译执行则实现了一个推送执行模型，它利用LLVM生成中间语言，自底向上将tuple留在寄存器中，每个Operator直接处理寄存器中的数据。
至于向量化计算则比较容易理解，它依然采用类似火山模型的拉取式模型，唯一的区别是其Operator的next()函数每次返回的是一批数据。通过使用SIMD（Single Instruction Multiple Data，单指令流多数据流），SIMD 可以在一条 CPU 指令上处理 2、4、8 或者更多份的数据，这样大大提升了效率。
这两种方法是不兼容的，不过也有系统实现了兼容。ClickHouse是如何实现的，我后面研究研究。

猜你喜欢

转载自blog.csdn.net/MoonWisher_liang/article/details/115336286

数据库优化技术之向量化计算和编译执行

火山模型和优化(向量化执行、编译执行)

编译优化之 - 向量化优化入门

数据库向量化入门与实现

Python基础之数组和向量化计算总结

数据库优化技术

mysql数据库优化之索引的维护和优化

MySql数据库优化之SQL和索引的优化

《向量数据库指南》——向量数据库和关系型数据库的区别？

embedding和向量数据库(pinecone)

向量数据库Annoy和Milvus

微软：向量搜索和向量数据库

向量数据库

《向量数据库指南》——向量数据库内核面临的技术挑战及应对措施

性能优化之数据库优化

网站优化之数据库优化

数据库优化之索引优化

数据库优化之sql优化

数据库优化之结构优化

PyTorch与向量化计算

Mysql数据库的优化技术

数据库优化技术内幕篇

Mysql数据库优化技术

数据库技术之《TSDB采集和展示方案》

云计算与数据库技术

161.Oracle数据库SQL开发之 SQL优化——比较执行查询的成本

mysql 数据库优化之执行计划(explain)简析

达梦数据库SQL优化之执行计划

小白也想搞科研（一）之DRL优化数据库查询执行计划

数据库技术之 Oracle数据库新建表空间和对应用户

今日推荐

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

周排行

rbac——界面、权限

Apache CXF + SpringMVC 整合发布WebService

so插件化

Vue.js实战系列---图标字体制作（svg格式）

PAT乙级 1007 素数对猜想(孪生素数对) (20分) ---（C语言 + 详细注释）

被IRM保护的文档，打开失败

Calendar和Date计算日期差的小问题

win10子系统ubuntu18.4安装docker

利用Wrap Shell Script定位Android Native内存泄漏

MySQL: Transaction (Part I - Basic Concept)

每日归档

更多

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)