OLAP引擎比较

一,spark sql与doris

spark虽然是一个计算引擎,但spark sql支持符合通用语法的sql查询,延迟为分钟级。

doris是一个OLAP数据库,支持对大数据的复杂查询,延迟为秒级。

doris比spark sql快,主要原因在于使用场景不同导致的架构不同。spark sql启动一个查询,需要进行资源调度、任务调度、任务分发,耗时更久。doris是常驻进程,启动一个doris查询后,快速的对sql生成执行计划,下发到执行引擎。

doris是完全在内存中处理数据,spark在内存不够时会借助磁盘,这也会拖慢spark sql的运行速度。

二,doris的案例

1,美团外卖使用doris构建近实时仓库

https://tech.meituan.com/2020/04/09/doris-in-meituan-waimai.html
以Doris引擎为驱动的ROLAP模式可以较好地处理汇总与明细、变化维的历史回溯、非预设维的灵活应用、准实时的批处理等场景。

而Kylin为基础的MOLAP模式在处理增量业务分析,固化维度场景,通过预计算以空间换时间方面依然重要。

数据库技术进步飞速,近期柏睿数据发布全内存分布式数据库RapidsDB v4.0支持TB级毫秒响应(处理千亿数据可实现毫秒级响应)。可以预见,数据库技术的进步将大大改善数仓的分层管理与应用支撑效率,业务将变得“定义即可见”,也将极大地提升数据的价值。

Doris既可以进行高效的实时计算,也可以进行明细查询,类似mysql数据,但其能处理的数据量又是mysql望尘莫及的。
在不确定的场景下,如历史数据会变化、维度不确定的场景下,doris是完美的解决方案

猜你喜欢

转载自blog.csdn.net/epitomizelu/article/details/121530350