KaiwuDB 多模数据库-时序性能优化

其他 2023-12-18 18:00:02 阅读次数: 0

12.23 源创会 · 上海站，聊聊 LLM 基础设施

随着物联网领域的快速发展，时序数据的产生和处理需求不断增长。为了满足实时性、高效性和准确性的要求，数据库需要进行时序性能优化，以提供快速的数据写入、实时查询和高效的数据存储与处理能力。

本期直播介绍了时序数据和时序数据库特征以及基于 TSBS 时序测试标准分析，并基于此解析了 KaiwuDB 的时序模型架构和优化设计。

一、时序基础概念

1. 时序基础概念

时间序列数据是指带时间标签的数据，主要由电力、化工、气象、地理信息等行业的各类实时监测、检查与分析设备所采集、产生的数据。

为了便于解释基本概念，以微电网的太阳能发电板作为典型时序数据场景。假设每个发电板采集电流、电压、温度三个量，有多个太阳能板。

Measurement：一类设备的集合；
Data source：一个具体的设备；
Tags：一个设备的描述标签；
Timestamp：本条时序数据的采集时间。

2. 时序数据库的特点

时序数据库全称为时间序列数据库。时间序列数据库指主要用于处理带时间标签（按照时间的顺序变化，即时间序列化）的数据。

基本特点：

大数据量的处理；
高压缩比；
冗余重复数据的一份存储；
时间序列分区处理；
一般没有事务相关处理。

二、TSBS 测试标准说明

1. TSBS 测试标准

TimeScale 开源项目：

时序数据的生成和写入；
时序场景的典型查询。

两个典型的应用场景：

DevOps – 服务器 CPU 监控场景有序的时间序列数据；
IoT – 物联网卡车车队场景存在无序和缺失的时间序列数据。

2. DevOps 场景（CPU-only）

CPU-only 场景特点：

数据间隔均为 10 秒；
场景五数据量最大 1.8 亿条记录，场景四数据量最小 1800 万条记录；
场景四和场景五设备数量较多，仅覆盖 3 分钟时间跨度。

3. 不同分类的 TSBS 语句分析

三、KaiwuDB 多模数据库时序引擎

1. 基本执行架构

应用层；
SQL Engine；
分布式层；
Storage Engine。

一般没有事务相关处理。

2. 时序优化改造

2.1 存储结构优化

针对时序数据的量大、递增、且部分数据为静态值的特点，存储结构做了如下演进：

大表，所有设备写入到一张表；
分表，一个设备一张表；
分区，按照时间划分数据区域；
合表，部分设备一组，静态属性合并存储，同时时间分区

2.2 KaiwuDB 执行计算架构优化

针对时序模型，KaiwuDB 做了一系列执行架构调整：

执行器下放；
采用 mmap 技术，减少数据拷贝；
分区并行；
数据裁剪；

定制执行计划；
Timebucket 等特殊时序算子；
多级动态并行。

2.3 KaiwuDB 时序统计信息

KaiwuDB 的针对时序查询的特征，定制和实现了一套时序预计算统计信息。其特点如下：

时序表是一种特殊的复合表；
模板表对应 tag 表；
实例表只是对应 tag 表中的一条索引，而非完整表；
数据写入时可以动态创建 tag 项并写入数据；
tag 表支持基本的统计信息，例如包含 TSBS；
查询支持通用数据读取；
特殊查询能够下推，例如多 tag 查询下推，单个 tag 特定聚合数据；
数据块按照时间分区，增加块的统计信息。

{{o.name}}

{{m.name}}

猜你喜欢

转载自my.oschina.net/u/5148943/blog/10150346

KaiwuDB 多模数据库-时序性能优化

KaiwuDB CTO 魏可伟：1.0 时序数据库技术解读

KaiwuDB 亮相 2023 可信数据库发展大会

KaiwuDB 数据库高可用方案及落地实现

KaiwuDB 数据库故障诊断工具详解

KaiwuDB 时序引擎数据存储内存对齐技术解读

KaiwuDB 通过中国信通院“可信数据库”性能与稳定性评测

KaiwuDB 数据服务平台 1.0 产品详解

深入了解 KaiwuDB 负载行为数据采集

融入数据浪潮，KaiwuDB 期待与您共赴 DTCC 2023

KaiwuDB 乱序数据处理功能解读

KaiwuDB 获 2023 可信数据库发展大会“双料”荣誉

KaiwuDB CTO 魏可伟：回归用户本位，打造“小而全”的数据库

KaiwuDB CTO 魏可伟：AIoT，用行业定义数据库

KaiwuDB 受邀亮相“ACDU 中国行”数据库技术沙龙（西安站）

KaiwuDB × 风电企业 | 高性能、低成本、释放数据价值

KaiwuDB 联合信通院数据库应用创新实验室召开数据库技术研讨沙龙

KaiwuDB CTO 魏可伟：多模架构 —“化繁为简”加速器

浪潮 KaiwuDB x 大数据中心 | 数据驱动政府治理能力快速提升

KaiwuDB 获评信通院 2023 大数据“星河”标杆案例

KaiwuDB 资深解决方案专家周幸骏：打造核心时序引擎，释放数据新价值

KaiwuDB CTO 魏可伟：万物互联，探索新一代数据底座

Spark 在 KaiwuDB 中的应用与实践

深度解读 KaiwuDB 的排序操作

深度解析 KaiwuDB 聚焦操作

KaiwuDB 成为中国信通院数据库应用创新实验室-汽车行业工作组副组长单位

Operator-sdk 在 KaiwuDB 容器云中的使用

KaiwuDB 发布智慧矿山解决方案

KaiwuDB 荣获稀土掘金引力榜-年度最佳实践案例

赋能矿山 | KaiwuDB 智慧矿山解决方案

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)