行存储和列存储 - 代码天地

行存储和列存储

其他 2018-12-05 03:04:56 阅读次数: 0

列存储的数据库更适合OLAP
行存储的数据库更适合OLTP

所谓的快只是针对于进行olap操作而言

我们知道，数据在存储中的基本单位为页，这也是进行数据读取时候基本单位，一次读取就是一次IO操作

以sql server为例，一个数据页大小为8K，数据页中存储的是数据，数据是连续存储的

那么我假设如下的4*4表格为一个数据页

再假设，有这样一个表格字段1 字段2
字段1的值为 col1value1,col1value2.....
字段2的值为col2value1,col2value2......

再假设一个excel的单元格为一个存储单位，数据总量占了2个页，
那么以行方式存储大概就这样的：

以列方式存储则是这样的：

这时，如果我需要执行如下查询(oltp典型查询)
select 字段1,字段2 from table where 字段1='col1value1'
以行方式查询（在有适当的索引情况下)，那么，执行一次以上查询，只需要扫描一次page1就可以了
以列方式查询，需要投其扫描page1 和page2共2次，分别取得字段1，字段2的单行值

OK，我们换成olap的典型查询
select avg(字段2) from table
--（注意，这里假设字段2为一个整型数据，而且无where条件限制，即需要扫描全部数据）
对于行存储，这个查询需要两次IO将全部数据放入内存后，进行页间数据的跳读（类随机读取)
对于列存储，只需要一次IO将page2放入内存后进行连续读取，如果字段2还有多页的话，也都是进行的物理连续读取

也就是说，在进行olap操作时候，不仅是减小了IO次数，而且把随机读取变为了连续读取

详细归纳为如下：

选择列式存储

基于一列或比较少的列计算的时候

经常关注一张表某几列而非整表数据的时候

数据表拥有非常多的列的时候

数据表有非常多行数据并且需要聚集运算的时候

数据表列里有非常多的重复数据，有利于高度压缩

选择HANA行式存储

关注整张表内容，或者需要经常更新数据

需要经常读取整行数据

不需要聚集运算，或者快速查询需求

数据表本身数据行并不多

数据表的列本身有太多唯一性的数据

猜你喜欢

转载自my.oschina.net/u/2000675/blog/2967574

行存储和列存储

行存储与列存储

行存储 VS 列存储

【转】传统的行存储和（HBase）列存储的区别

行存储和列存储的区别及各自的应用场景

传统的(Oracle)行存储和（HBase）列存储的区别

数据库行存储和列存储的区别

数据的列存储转换为行存储

数据结构 || 二维数组按行存储和按列存储

大数据存取的选择：行存储还是列存储？

【转】大数据存取的选择：行存储还是列存储？

es索引优化(行存储、列存储、索引)

数据库行存储及列存储详解

行式存储和列式存储的比较

列式存储和行式存储

列式存储和行式存储的区别

matlab将矩阵按行和列存储到txt中

二维数组的行地址、列地址，与元素的存储

存储过程简介和案列

数据库行式存储和列式存储的区别

数据库中的【行式存储】和【列式存储】

列式存储和行式存储的理解详解

leetcode-867-Transpose Matrix（矩阵由按行存储变成按列存储）

矩阵的按行优先存储或按列优先存储

SQL Server—— 在ETL过程列存储索引vs 行存储索引

大数据-什么是hbase？&&hbase的行存储及列存储&&关系数据库和非关系型数据库的优劣

行式存储与列式存储

列式存储与行式存储

SQL Server 列存储索引性能总结（6）——聚集和非聚集列存储索引的压缩

什么是列存储？

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)