Apache Doris性能优化之Join Reorder和Doris Join调优原则

企业开发 2022-09-26 20:58:08 阅读次数: 0

目录

1. Join Reorder
- 1.1 介绍
- 1.2 Join Reorder逻辑
2. Doris Join调优原则

1. Join Reorder

1.1 介绍

Join Reorder功能可以通过代价模型自动帮助调整SQL中Join的顺序，先让大表和小表进行过滤，这样能过滤掉大表中大部分的数据。以便获得最优的Join效率。可通过会话变量开启，默认是关闭的

mysql> show variables like '%enable_cost_based_join_reorder%';
+--------------------------------+-------+
| Variable_name                  | Value |
+--------------------------------+-------+
| enable_cost_based_join_reorder | false |
+--------------------------------+-------+
1 row in set (0.01 sec)

mysql> 
mysql> set enable_cost_based_join_reorder=true;
Query OK, 0 rows affected (0.01 sec)

mysql>

可以通过explain graph查看join的先后关系

1.2 Join Reorder逻辑

让大表、跟小表尽量做Join，它生成的中间结果是尽可能小的
把有条件的Join表往前放，也就是说尽量让有条件的Join表进行过滤
Hash Join的优先级高于Nest Loop Join，因为Hash join本身是比Nest Loop Join快很多的

2. Doris Join调优原则

在做Join的时候，要尽量选择同类型或者简单类型的列，同类型的话就减少它的数据Cast，简单类型本身Join计算就很快
尽量选择Key列进行Join，原因前面在Runtime Filter的时候也介绍了，Key列在延迟物化上能起到一个比较好的效果
大表之间的Join ，尽量让它Co-location ，因为大表之间的网络开销是很大的，如果需要去做Shuffle的话，代价是很高的
合理的使用Runtime Filter，它在Join过滤率高的场景下效果是非常显著的。但是它并不是万灵药，而是有一定副作用的，所以需要根据具体的SQL的粒度做开关
涉及到多表Join的时候，需要去判断Join的合理性。尽量保证左表为大表，右表为小表，然后Hash Join会优于Nest Loop Join。必要的时可以通过SQL Rewrite，利用Hint去调整Join的顺序

猜你喜欢

转载自blog.csdn.net/yy8623977/article/details/126177005

Apache Doris性能优化之Join Reorder和Doris Join调优原则

Apache Doris的性能优化之Runtime Filter

Apache Doris

使用Prometheus和Grafana监控Apache Doris

apache性能调优

Apache Doris 技术调研

Apache Doris 2.1.0 版本发布：开箱盲测性能大幅优化，复杂查询性能提升 100%

百亿大表 Join 提速 300倍！Apache Doris 在约苗数据平台的实时数仓建设实践

Doris-03-Doris的查询(Join查询、去重)

【高手问答汇总】——聊聊 Apache Doris 的性能优化实战技巧

活动速递｜ Apache Doris 性能优化实战系列直播课程初公开，诚邀您来参加！

Apache Doris的Bitmap索引和BloomFilter索引使用

Apache Doris简单易用、高性能和统一的分析数据库

Apache Doris 成为 Apache 顶级项目

[转]Apache Doris资料汇总

Apache Doris 基本使用总结

Apache Doris 安装部署指南

Apache Doris 资源隔离详解

Apache Doris 详细教程（二）

Apache Doris 详细教程（一）

Apache Doris 详细教程（三）

Apache Doris 入门 10 问

join查询和性能优化

LAMP之Apache调优

性能测试-性能调优主要方向和原则（15）

mysql 使用心得和性能调优原则

最佳实践｜Apache Doris 在小米数据场景的应用实践与优化

性能调优7：多表连接 - join

读《MySQL性能调优与架构设计》笔记之Join 的实现原理及优化思路

Apache SeaTunnel & Apache Doris7月联合Meetup，数据集成和分析

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)