阿里一面：SQL 优化有哪些技巧？

MySQL 相信大家一定都不陌生，但是不陌生不一定会用！

会用不一定能用好！

今天就带大家复习一个高频面试考点，SQL 优化有哪些技巧？

当然这个还是非常有实用价值的，工作中你也一定用的上。如果应用得当，升职加薪，指日可待

1、创建索引

一定要记得创建索引，创建索引，创建索引

重要的事说三遍！

执行没有索引的 SQL 语句，肯定要走全表扫描，慢是肯定的。

这种查询毫无疑问是一个慢 SQL 查询。

那么问题来了，是不是要收集所有的 where 查询条件，然后针对所有的组合都创建索引呢？

答案肯定是否定的。

MySQL 为了提升数据查询速率，采用 B+ 树结构，通过 空间换时间 设计思想。另外每次对表数据做更新操作时，都要调整对应的 索引树 ，执行效率肯定会受影响。

本着 二八原则 ，互联网请求 读多写少 的特点，我们一定要找到一个平衡点。

阿里巴巴的开发者手册建议，单表索引数量控制在5个以内，组合索引字段数不允许超过5个

其他建议：

禁止给表中的每一列都建立单独的索引
每个Innodb表必须有个主键
要注意组合索引的字段的顺序
优先考虑覆盖索引
避免使用外键约束

2、避免索引失效

不要以为有了索引，就万事大吉。

殊不知， 索引失效 也是慢查询的主要原因之一。

常见的索引失效的场景有哪些？

以 % 开头的 LIKE 查询
创建了组合索引，但查询条件不满足 '最左匹配原则'。如：创建索引 idx_type_status_uid（type,status,uid），但是使用 status 和 uid 作为查询条件。
查询条件中使用 or，且 or 的前后条件中有一个列没有索引，涉及的索引都不会被使用到
在索引列上的操作，函数 upper()等，or、！= （<>）,not in 等

3、锁粒度

MySQL 的存储引擎分为两大类：MyISAM 和 InnoDB 。

MyISAM 支持表锁；InnoDB 支持行锁和表锁

更新操作时，为了保证表数据的准确性，通常会加锁，为了提高系统的高并发能力，我们通常建议采用 行锁 ，减少 锁冲突 、 锁等待 的时间。所以，存储引擎通常会选择 InnoDB

行锁可能会升级为表锁，有哪些场景呢？

如果一个表批量更新，大量使用行锁，可能导致其他事务长时间等待，严重影响事务的执行效率。此时，MySQL会将 行锁 升级为 表锁
行锁是针对索引加的锁，如果 条件索引失效 ，那么 行锁 也会升级为 表锁

注意：行锁将锁的粒度缩小了，进而提高了系统的并发能力。但是也有个弊端，可能会产生死锁，需要特别关注。

4、分页查询优化

如果要开发一个列表展示页面并支持翻页时，我们通常会这样写 SQL

select * from 表  limit #{start}, #{pageSize};

随着翻页的深度加大， start 值越来越大，比如：limit 10000 ，10

看似只返回了 10 条数据，但数据库引擎需要查询 10010 条记录，然后将前面的 10000 条丢弃，最终只返回最后的 10 条记录，性能可想而知

针对这个问题，我们通常有另一种解决方案：

先定位到上一次分页的最大 id，然后对 id 做条件索引查询。由于数据库的索引采用 B+ 树结构，这样可以一步到位

select * from 表 where id > #{id}  limit  #{pageSize};

任何事情，有利就有弊

这种翻页方式只支持 上一页 、 下一页 ，不支持跨越式直梯翻页

上图是淘宝的商品搜索列表，为了用户体验更好，采用的也是 直梯式 翻页。

为了避免翻页过深，影响性能，产品交互上做了一些取舍，对总页数做了限制，最多支持 100 页。

上图是淘宝的商品搜索列表，为了用户体验更好，采用的也是 直梯式 翻页。

为了避免翻页过深，影响性能，产品交互上做了一些取舍，对总页数做了限制，最多支持 100 页。

方案二：采用子查询

select * from 表 where id > ( select id from 表 order by id limit 10000 1) limit 20;

将原来的单 SQL 查询拆成两步：

首先，查询出一页数据中的最小 id
然后，通过 B+ 树，精确定位到 最小id的索引树节点位置 ，通过 偏移量 读取后面的 20条数据

阿里的规约手册也有对应描述：

5、避免 select *

反面案例：

select  * from 表 where buyer_id = #{buyer_id}

我们知道，MySQL 创建表后，具体的行数据存储在主键索引（属于聚簇索引）的叶子节点。

二级索引属于非聚簇索引，其叶子节点存储的是 主键值

select * 的查询过程：

先在 buyer_id 的二级索引 B+ 树，查出对应的主键 id 列表
然后进行 回表 操作，在主键索引中查询 id 对应的行数据

所以，我们需要罗列清楚必须的查询字段，且字段尽量在 覆盖索引 中，从而减少 回表 操作。

6、EXPLAIN 分析 SQL 执行计划

授人以鱼不如授人以渔

除了知晓常见的不规范 SQL 写法，在开发过程中，避免踩坑

我们还应知道，出现了慢 SQL 该如何排查、优化

实验安排起来

创建表

CREATE TABLE `user` (
  `id` bigint(20) unsigned NOT NULL AUTO_INCREMENT COMMENT '自增主键',
  `income` bigint(20) NOT NULL COMMENT '收入',
  `expend` bigint(20) NOT NULL COMMENT '支出',
  PRIMARY KEY (`id`),
  KEY `idx_income` (`income`)
) ENGINE=InnoDB AUTO_INCREMENT=1 DEFAULT CHARSET=utf8 COMMENT='用户表';

CREATE TABLE `biz_order` (
  `id` bigint(20) unsigned NOT NULL AUTO_INCREMENT COMMENT '自增主键',
  `user_id` bigint(20) NOT NULL COMMENT '用户id',
  `money` bigint(20) NOT NULL COMMENT '金额',
  PRIMARY KEY (`id`),
  KEY `idx_user_id` (`user_id`)
) ENGINE=InnoDB AUTO_INCREMENT=1 DEFAULT CHARSET=utf8 COMMENT='订单表';

插入记录：

insert into user values(10,100,100);
insert into user values(20,200,200);
insert into user values(30,300,300);
insert into user values(40,400,400);

insert into biz_order values(1,10,30);
insert into biz_order values(2,10,40);
insert into biz_order values(3,10,50);
insert into biz_order values(4,20,10);

比如下面的语句，我们看是否使用了索引，可以通过 explain 分析相应的执行计划

explain select * from user where  id<20;

接下来，我们来逐一来说明每个字段的含义

id：每一次 select 查询都会生成一个 id，值越大，优先级越高，会被优先执行
select_type：查询类型，SIMPLE（普通查询，即没有联合查询、子查询）、PRIMARY（主查询）、UNION（UNION 中后面的查询）、SUBQUERY（子查询）等
table：查询哪张表
partitions：分区，如果对应的表存在分区表，那么这里就会显示具体的分区信息
type：执行方式，是 SQL 优化中一个很重要的指标，结果值从好到差依次是：system > const > eq_ref > ref > range > index > ALL

system/const：表中只有一行数据匹配，此时根据索引查询一次就能找到对应的数据
eq_ref：使用唯一索引扫描，常见于多表连接中使用主键和唯一索引作为关联条件
ref：非唯一索引扫描，还可见于唯一索引最左原则匹配扫描
range：索引范围扫描，比如，<，>，between 等操作
index：索引全表扫描，此时遍历整个索引树
ALL：表示全表扫描，需要遍历全表来找到对应的行

possible_keys：可能用到的索引
key：实际用到的索引
key_len：索引长度
ref：关联 id 等信息
rows：查找到记录所扫描的行数，SQL 优化重要指标，扫描的行数越少，性能越高
filtered：查找到所需记录占总扫描记录数的比例

Extra：额外的信息

explain select * from user u , biz_order b where u.id=b.user_id and u.id<20;

7、Show Profile 分析 SQL 执行性能

Show Profile 与 EXPLAIN 的区别是，前者主要是在外围分析；后者则是深入到 MySQL 内核，从执行线程的状态和时间来分析。

MySQL 是在 5.0.37 版本之后才支持 Show Profile ， select @@have_profiling 返回 YES 表示功能已开启。

mysql> show profiles;
Empty set, 1 warning (0.00 sec)

显示为空，说明profiles功能是关闭的。

通过下面命令开启

mysql> set profiling=1;
Query OK, 0 rows affected, 1 warning (0.00 sec)

获取 Query_ID 之后，通过 show profile for query ID ，查看 SQL 语句在执行过程中线程的每个状态所消耗的时间

以下是我整理的MySQL一般大厂都会出的面试题！

数据库存储引擎
InnoDB (B+树)
TokuDB ( Fractal Tree-节点带数据)
MyIASM
Memory
数据库引擎有哪些
InnoDB与MyISAM的区别
索引
常见索引原则有
数据库的三范式是什么
第一范式(1st NF -列都是不可再分)
第二范式(2nd NF -每个表职描述一件事情)
第三范式(3rd NF -不存在对非主键列的传递依赖)
数据库是事务
SQL优化
简单说-说drop、delete 与truncate的区别
什么是视图
什么是内联接、左外联接、右外联接?
并发事务带来哪些问题?
事務隔离级别有哪些?MySQL的默认隔离级别是?
大表如何优化?
水平分区
分库分表之后,id主键如何处理
存储过程(特定功能的SQL语句集)
存储过程优化思路
触发器(一段能自动执行的程序)
数据库并发策略
MySQL有哪几种锁?
MySQL中有哪些不同的表格?
简述在MySQL数据库中MyISAM和InnoDB的区别
MySQL中InnoDB支持的四种事务隔离级别名称，以及逐级之间的区别?
CHAR和VARCHAR的区别?
主键和候选键有什么区别?
myisamchk是用来做什么的?
MyISAM Static 和MyISAM Dynamic有什么区别?
如果一个表有-列定义为TIMESTAMP,将发生什么?
你怎么看到为表格定义的所有索引?
LIKE声明中的%和是什么意思?
列对比运算符是什么?
BLOB和TEXT有什么区别?
MySQL_ fetch_ array 和MySQL_ fetch_ object 的区别是什么?
MyISAM表格将在哪里存储,并且还提供其存储格式?
MySQL如何优化DISTINCT?
如何显示前50行?
可以使用多少列创建索引?
NOW ()和CURRENT_ DATE () 有什么区别?
什么是非标准字符串类型?
什么是通用SQL函数?
MySQL支持事务吗?
MySQL里记录货币用什么字段类型好
MySQL有关权限的表都有哪几个?
列的字符串类型可以是什么?
MySQL数据库作发布系统的存储，一天五万以上的增量,预计运维三年，怎么优化?
锁的优化策略

有图有答案需要的小火伴，可在下方宫中号【不脱发有志青年】免费货区