InfluxDB vs TimeScaleDB 功能/性能对比 (一)

本篇主要对InfluxDB和TimeScaleDB进行功能和性能对比。

目录

目的及最终结论

对比InfluxDB与TimeScaleDB的功能

对比InfluxDB与TimeScaleDB数据写入性能

对比InfluxDB与TimeScaleDB数据存储空间占用

对比InfluxDB与TimeScaleDB数据读取性能

功能对比

性能对比

测试环境

测试机

TimeScaleDB配置

InfluxDB配置

测试方式

测试数据

测试结果

数据写入性能

存储空间占用

数据读取性能


目的及最终结论

对比InfluxDB与TimeScaleDB的功能

结论:TimeScaleDB的功能更加完善。

对比InfluxDB与TimeScaleDB数据写入性能

结论:InfluxDB的写入性能约为TimeScaleDB的两倍

使用相同的表结构,不做任何表结构层面的优化,在同一台机器进行测试,InfluxDB的写入性能约为TimeScaleDB的两倍

对比InfluxDB与TimeScaleDB数据存储空间占用

结论:InfluxDB的存储空间占用不到TimeScaleDB的50%

使用相同的表结构,不做任何表结构层面的优化,在同一台机器进行测试,InfluxDB的存储空间占用不到TimeScaleDB的50%

对比InfluxDB与TimeScaleDB数据读取性能

暂未完成

功能对比

TimeScaleDB的功能更完善。TimeScaleDB作为PostgreSQL的扩展,只是在数据存储上利用PostgreSQL的特性做了一些优化,PostgreSQL支持的功能,TimeScaleDB全部支持。而InfluxDB是分析型时序数据库,舍弃了很多交易型数据库必须支持的功能。

增删改:InfluxDB不支持对数据的修改和删除(只能通过RP删除数据,具体可参考 《InfluxDB基础知识(二)》),TimeScaleDB都支持。

索引:InfluxDB时间戳和tags带索引,不支持自定义索引。TimeScaleDB更加灵活,可自定义索引

约束:InfluxDB不支持,TimeScaleDB支持

聚合函数:常用的聚合函数两种数据库都支持,TimeScaleDB的函数覆盖面更广一些。

性能对比

测试环境

测试机

centos虚拟机

cpu: AMD Ryzen 5 1600 Six-Core(4线程)

内存:8G

磁盘:机械硬盘

TimeScaleDB配置

版本:PostgreSQL 10.4+TimeScaleDB 0.10

shared_buffers = 2g (推荐设置为机器内存的1/4,默认值为1g)

wal_buffers = 64m (推荐设置为shared_buffers的1/32,默认值为16m)

wal_writer_delay = 800ms(默认值200ms)

除上述修改之外均使用默认配置

InfluxDB配置

版本:1.6.0

cache-max-memory-size = "2g" (默认值为1g)

cache-snapshot-memory-size = "100m"(默认值为25m)

[http] log-enabled = false

wal与data目录指定不同磁盘

除上述修改之外均使用默认配置

测试方式

使用JAVA代码编写InfluxDB和TimeScaleDB的写入程序,在本地运行测试程序读写服务器的数据库,写入时batchsize为5000,读取数据时全表扫描读取

batchsize取用5000的原因是:使用上述表结构测试,TimeScaleDB和 InfluxDB的写入batchsize逐渐提升的过程中,当batchsize接近5000时性能有明显提升,当batchsize大于5000时InfluxDB性能下降明显,TimeScaleDB性能有微小提升。综合考虑后将batchsize设置为5000进行测试。测试数据如图:

 

耗时(S)

batchsize

timeScaleDB

InfluxDB

100

415

——

10

390

——

1

438

677

5000

477

355

1000

590

499

500

611

606

100

866

1090

测试数据

表结构:

CREATE TABLE cpu_ts (
    "time" timestamp with time zone, --精度ms,以1ms递增
    hostname text,  --值为host_0到host_3999,循环取值
    usage_user double precision, --以下其他字段全部为随机生成的double值
    usage_system double precision,
    usage_idle double precision,
    usage_nice double precision,
    usage_iowait double precision,
    usage_irq double precision,
    usage_softirq double precision,
    usage_steal double precision,
    usage_guest double precision,
    usage_guest_nice double precision
)

总行数:1亿行

总数据量:18.1G

TimeScaleDB:使用默认的时间分区跨度:1个月 ,所有数据都将写入同一个分区

InfluxDB:使用默认的时间分区跨度:7天,所有数据都将写入同一个分区

测试结果

由于InfluxDB的时间戳是有索引的 ,因此测试TimeScaleDB时在时间戳字段创建了btree索引。

数据写入性能

单并发

单并发写入的情况下,InfluxDB的写入性能约为TimeScaleDB的2倍,写入数据的过程中,TimeScaleDB内存消耗明显高于InfluxDB。

  行数吞吐量 CPU 内存 网络 磁盘
TimeScaleDB 15865 15+% 50-99% 5M/s 10%-80%
InfluxDB 33101 20+% 30-50% 10+M/s 0-100%

多并发

4并发写入,InfluxDB的性能表现依旧比TimeScaleDB好,将近2倍写入性能,资源消耗差异不大。

  并发数 行数吞吐量 CPU 内存 网络 磁盘
TimeScaleDB 4 43572 50+% 99% 10-20M/s 30%-100%
InfluxDB 4 94786 60+% 90% 30-40M/s 20%-100%

存储空间占用

以上测试数据,InfluxDB存储空间占用不到TimeScaleDB的一半。(原始数据量18.1G)

  空间占用(G)
TimeScaleDB 16.4
InfluxDB 7.3

数据读取性能

暂未完成

猜你喜欢

转载自blog.csdn.net/u013480467/article/details/81478514