记一次生产慢sql索引优化及思考 | 京东云技术团队

移动开发 2023-12-18 17:11:22 阅读次数: 0

12.23 源创会 · 上海站，聊聊 LLM 基础设施

一问题重现

夜黑风高的某一晚，突然收到一条运营后台数据库慢sql的报警，耗时竟然达到了60s。

看了一下，还好不是很频繁，内心会更加从容排查问题，应该是特定条件下没有走到索引导致，如果频繁出现慢查询，可能会将数据库连接池打满，导致数据库不可用，从而导致应用不可用。

二问题排查

报警自带定位慢sql语句，这个是很早就上线的一条sql语句，下面对sql语句进行了简化：

select * from xxx where gear_id=xxx and examine=xxx order by id desc limit 10，这是个简单的根据流量池gear_id查询，按照主键id倒序进行分页查询10条数据的语句。

在examine=2时查询速度很快，但是在examine=3时，查询速度极慢，然后分别在不同的examine下查看执行计划，得到的执行计划都是一致的。

查看执行计划，发现possible_keys中有idx_gear_id索引，但是实际用到的key却是PRIMARY,并且extra中明确用了where条件进行数据过滤。到现在就明白了这个sql是在主键聚簇索引上进行扫描，然后用where语句条件进行过滤，时间耗费在这了。

这个也解释了为什么examine在不同状态下的耗时不一样，取决于where过滤扫描的行数，扫描行数越多，执行越慢，但同一个问题是都没走到我们已有的索引idx_gear_id。

当单表数量较小时，无论有没有索引，或者走主键索引扫描或者普通索引都很快，很容易忽略这些问题，此时的表现就是你好，我好，大家好，然后随着数据量的增大，当达到千万级别或者亿级时，慢查询的问题就凸显出来了。

三原理剖析

为什么mysql会选择这个不合适的主键聚簇索引?

以常用的InnoDb存储引擎为例，看一下聚簇索引和非聚簇索引查询区别:

聚簇索引：通常就是按照每张表的主键构造一颗B+树，叶子节点中存放的就是整张表的行记录数据，即数据和主键都在索引上

非聚簇索引：表的二级索引字段（比如唯一索引，联合索引等）构造的一颗B+树，叶子节点存储的是Key字段+主键值，即非聚集索引的叶节仍然是索引节点，但它有一个指向最终数据索引的指针。

聚簇索引查询原理：

非聚簇索引查询原理（二级索引查询）：

由以上的索引数据结构可以看出，因为聚簇索引将索引和数据保存在同一个B+树中，因此通常从聚簇索引中获取数据比非聚簇索引更快，而非聚簇索引在获取到叶子节点的主键后，需要再次查询主键索引，即回表查询行记录数据。当然如果查询的列只是索引字段，比如查询姓名和年龄，可以创建联合索引，即索引存储的内容即为需要查询的内容，这种查询速度往往比主键索引更快，这种索引查询又称为覆盖索引。

什么是回表？

将以上的索引数据映射成常见的用户表user的索引为例,上面的聚簇索引就是以id字段为主键的索引,name字段为非聚簇索引，还有age等其他表字段是非索引字段，示例sql：select * from user where id = 1; 这条 SQL 语句就不需要回表。原因是根据主键的查询方式，则只需要搜索 id聚簇索引这棵 B+ 树，就可以查到对应的数据。

但当我们使用非聚簇索引 name 这个索引来查询 name = b 的记录时就要用到回表。原因是通过 name 这个二级索引查询方式，则需要先搜索 name 索引树，然后得到主键 id，即PK的值为 1，再到主键id聚簇索引树再搜索一次。这种根据二级索引查询到主键id,再根据主键id查询主键聚簇索引的过程就称为回表。

回到为什么mysql会选择这个不合适的主键聚簇索引问题本身，mysql执行器认为使用二级索引查出来的数据太多了，还需要基于磁盘做临时存储进行排序，然后排序取出10条，然后进行回表查询字段，性能可能会很差，所以采用了直接采用了按顺序扫描主键聚簇索引，和where条件gear_id=xxx and examine=xxx进行对比，最多放10条即可，这种情况就是数量小的时候没问题，但是当数据量大的时候，就需要一直扫描所有的数据，直到查到符合where条件的10条数据为止，同时耗时也急剧增长。

四解决问题

为了快速解决问题，可以采用强制索引force index，即在写sql语句时指定使用具体的索引

sql示例：select * from xxx force index (idx_gear_id) where gear_id=xxx and examine=3 order by id desc limit 10,强制使用idx_gear_id这个索引。

以下为使用强制索引的执行计划：

可以看到实际使用的索引key就是idx_gear_id,执行耗时在几百毫秒，运营后台的业务人员完全可接受。

五长期优化

由于表的数据越来越多，查询条件错综复杂，还有用json字段查询问题，决定将数据异构到es查询，将json字段打平，es天然支持复杂的查询条件，查询响应更快。

es数据同步方案：

在ES数据同步链路中，通过京东科技中间件DTS监听数据库的binlog，将索引字段（查询条件字段）及业务唯一id写入ES。

在业务运营查询时，根据复杂的查询条件，先去ES查询，将业务唯一id查出，再根据业务唯一id去DB中查询业务明细数据，同时解决了业务查询的复杂性和查询性能。

作者：京东科技张石磊

来源：京东云开发者社区转载请注明来源

{{o.name}}

{{m.name}}

猜你喜欢

转载自my.oschina.net/u/4090830/blog/10322126

记一次生产慢sql索引优化及思考 | 京东云技术团队

慢 SQL 优化之索引的作用是什么？ | 京东云技术团队

浅谈SQL优化小技巧 | 京东云技术团队

关于自动限流的思考 | 京东云技术团队

系统架构合理性的思考 | 京东云技术团队

记一次Native memory leak排查过程 | 京东云技术团队

让代码优雅起来：记一次代码微重构实践 | 京东云技术团队

React请求机制优化思路 | 京东云技术团队

行云部署成长之路--慢SQL优化之旅 | 京东云技术团队

一文浅谈Mockito使用 | 京东云技术团队

京东统一头尾管理系统探索实践 | 京东云技术团队

京东门详一码多端探索与实践 | 京东云技术团队

【问题排查篇】一次业务问题对 ES 的 cardinality 原理探究 | 京东云技术团队

一次网络请求中的流量分发过程 | 京东云技术团队

一次元数据空间内存溢出的排查记录 | 京东云技术团队

从头到尾说一次 Spring 事务管理（器） | 京东云技术团队

记一次JSF异步调用引起的接口可用率降低 | 京东云技术团队

h2database BTree 设计实现与查询优化思考 | 京东云技术团队

千万级数据深分页查询SQL性能优化实践 | 京东云技术团队

记一次生产慢sql查询的解决

使用第一性原理思维思考如何打造提高生产力的平台 | 京东云技术团队

真·Redis缓存优化—97%的优化率你见过嘛？ | 京东云技术团队

Netty服务端开发及性能优化 | 京东云技术团队

架构师日记-从代码到设计的性能优化指南 | 京东云技术团队

大型 3D 互动开发和优化实践 | 京东云技术团队

烂怂if-else代码优化方案 | 京东云技术团队

京喜APP - 图片库优化 | 京东云技术团队

持续优化 XView 性能，大促弹窗搭投实践 | 京东云技术团队

从原理聊JVM（五）：JVM的编译过程和优化手段 | 京东云技术团队

营销系统黑名单优化：位图的应用解析 | 京东云技术团队

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

周排行

Metasploit文件目录与入侵基本概念

跨域(CORS)请求问题[No 'Access-Control-Allow-Origin' header is present on the requested resource]常见解决方案

CodeIgniter 源码解读之 CodeIgniter.php（二）

SAS入门之（四）改变数据类型

初识元组

[数学建模]数学建模算法和模型（B站视频）（二）

Nginx 服务器源码安装配置流程

C#实现语音视频录制【基于MCapture + MFile】

开发进度4

下载安装vue的方法网址

每日归档

更多

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)