MySQL（高级、面试） —— （MySQL优化一）Explain 详解

通过在select+sql语句前加上explain，我们可以看出：
（1）表的读取顺序，id（table是id对应的表）
（2）数据读取操作的操作类型，select type
（3）哪些索引可以使用，possible_keys
（4）哪些索引被实际使用，key
（5）表之间的引用，ref
（6）每张表有多少行被优化器查询，rows

三、Explain 各字段的含义及其作用

Explain各字段的解释
序号	字段名	字段作用描述
1	id	查询的序号，包含一组数字，表示查询中执行select子句或操作表的顺序两种情况 id相同，执行顺序从上往下 id不同，id值越大，优先级越高，越先执行
2	select_type	查询类型，主要用于区别普通查询，联合查询，子查询等的复杂查询 1、simple ——简单的select查询，查询中不包含子查询或者UNION 2、primary ——查询中若包含任何复杂的子部分，最外层查询被标记 3、subquery——在select或where列表中包含了子查询 4、derived——在from列表中包含的子查询被标记为derived（衍生），MySQL会递归执行这些子查询，把结果放到临时表中 5、union——如果第二个select出现在UNION之后，则被标记为UNION，如果union包含在from子句的子查询中，外层select被标记为derived 6、union result:UNION 的结果
3	table	输出的行所引用的表
4	type	显示联结类型，显示查询使用了何种类型，按照从最佳到最坏类型排序 1、system：表中仅有一行（=系统表）这是const联结类型的一个特例。 2、const：表示通过索引一次就找到，const用于比较primary key或者unique索引。因为只匹配一行数据，所以如果将主键置于where列表中，mysql能将该查询转换为一个常量 3、eq_ref:唯一性索引扫描，对于每个索引键，表中只有一条记录与之匹配。常见于唯一索引或者主键扫描 4、ref:非唯一性索引扫描，返回匹配某个单独值的所有行，本质上也是一种索引访问，它返回所有匹配某个单独值的行，可能会找多个符合条件的行，属于查找和扫描的混合体 5、range:只检索给定范围的行，使用一个索引来选择行。key列显示使用了哪个索引，一般就是where语句中出现了between,in等范围的查询。这种范围扫描索引扫描比全表扫描要好，因为它开始于索引的某一个点，而结束另一个点，不用全表扫描 6、index:index 与all区别为index类型只遍历索引树。通常比all快，因为索引文件比数据文件小很多。 7、all：遍历全表以找到匹配的行 system > const > eq_ref > ref > range > index > all 注意:一般保证查询至少达到range级别，最好能达到ref。
5	possible_keys	指出MySQL能使用哪个索引在该表中找到(可能使用到的索引)
6	key	显示MySQL实际决定使用的键(索引)。如果没有选择索引,键是NULL。查询中如果使用覆盖索引，则该索引和查询的select字段重叠。
7	key_len	表示索引中使用的字节数，该列计算查询中使用的索引的长度在不损失精度的情况下，长度越短越好。如果键是NULL,则长度为NULL。该字段显示为索引字段的最大可能长度，并非实际使用长度。
8	ref	显示索引的哪一列被使用了，如果有可能是一个常数，哪些列或常量被用于查询索引列上的值
9	rows	根据表统计信息以及索引选用情况，大致估算出找到所需的记录所需要读取的行数
10	Extra	包含不适合在其他列中显示，但是十分重要的额外信息 1、Using filesort：说明mysql会对数据适用一个外部的索引排序。而不是按照表内的索引顺序进行读取。MySQL中无法利用索引完成排序操作称为“文件排序” 2、Using temporary:使用了临时表保存中间结果，mysql在查询结果排序时使用临时表。常见于排序order by和分组查询group by。 3、Using index:表示相应的select操作用使用覆盖索引，避免访问了表的数据行。如果同时出现using where，表名索引被用来执行索引键值的查找；如果没有同时出现using where，表名索引用来读取数据而非执行查询动作。 4、Using where :表明使用where过滤 5、using join buffer:使用了连接缓存 6、impossible where:where子句的值总是false，不能用来获取任何元组 7、select tables optimized away：在没有group by子句的情况下，基于索引优化Min、max操作或者对于MyISAM存储引擎优化count（），不必等到执行阶段再进行计算，查询执行计划生成的阶段即完成优化。 8、distinct*：优化distinct操作，在找到第一匹配的元组后即停止找同样值的动作。

三、SQL 执行顺序

想要优化SQL，必须清楚知道SQL的执行顺序，这样再配合explain才能事半功倍！

3.1、完整SQL语句

select distinct 
        <select_list>
from
    <left_table><join_type>
join <right_table> on <join_condition>
where
    <where_condition>
group by
    <group_by_list>
having
    <having_condition>
order by
    <order_by_condition>
limit <limit number>

3.2 SQL执行顺序

1、from <left_table><join_type>
2、on <join_condition>
3、<join_type> join <right_table>
4、where <where_condition>
5、group by <group_by_list>
6、having <having_condition>
7、select
8、distinct <select_list>
9、order by <order_by_condition>
10、limit <limit_number>

四、说人话----Explain各字段意思的案例分析

4.1、id

select查询的数字序列号，表示查询中执行select子句、或多表联合查询时操作表的顺序；
· （1）id相同，执行顺序由上至下

从t1、t2、t3三张表中查询t2表的全部，查询条件是：t1.id=t2.id 、t1.id=t3.id、t1的其他字段是空；
优化器对于同一个where内部的条件，默认是从右往左读取的；
所以三张表的执行顺序是：t1 -> t3 -> t2；

（2）id不同，id越大执行优先级越高

如果是子查询，id的序列号会递增，越是在里面的子查询越优先执行，类似于递归的思想；( )里的语句具有优先级

从t2表中查询t2表的全部，查询条件是id，查询条件是三层嵌套：
从表t1查询id——id是从表t3中查询到的t3表的id——t3表的其他字段为空；
用递归的思想，很容易判断，表的执行顺序：t3 -> t1 -> t2

（3）id同时存在相同和不同的情况，id不同的id大的优先执行，id相同的从上到下执行

这里需要引入一个概念，衍生虚表查询（Derived）：
从原表中截取部分信息，组成的结果集可以构成一张新表，这张表并不实际存在，作为一张虚表被调用；这种查询就叫衍生虚表查询；

（从表t3中查询t3表的id，查询条件是其他字段为空）将括号中t3表的查询条件，的结果集作为一张虚表s1，
从虚表s1、表t2中，查询表t2的全部，查询条件是s1.id=t2.id；
所以，查询的顺序是：t3 -> derived2 -> t2
derived2指，由id=2时，即表t3的结果集衍生构成的虚表s1；

4.2、select_type

查询的类型，一共有以下6种表的查询类型：

· （1）SIMPLE
简单查询，查询中不包含子查询、union（联合查询）；

· （2）PRIMARY
查询中若包含子查询，则最外层查询被标记为PRIMARY；

· （3）SUBQUERY
在select或where列表中的子查询

· （4）DERIVED
典型语法：from ( 子查询 ) s1，
在from列表中包含的子查询，被标记为DERIVED（衍生），这个子查询执行后的结果集放在一张虚表s1中；

· （5）UNION
若第二条select出现在union之后，则标记为union联合多表查询；
若union包含在from字句的查询中，即select 属性 from（子查询1 union 子查询2）s1，这种外层的select被标记为DERIVED；

· （6）UNION RESULT
从UNION表中获取结果的SELECT

4.3、 table

指id对应的表，通过id判断表的执行顺序；
也指这一行的数据是关于哪张表的；

4.4、 type

显示查询时，使用了哪种查询类型，日常工作中经常接触到的有以下7种，性能由最好到最差依次是：
system > const > eq_ref > ref > range > index > ALL
一般需要保证查询类型等级达到range，最好能达到ref，避免使用ALL。

· （1）system
系统查询，指表中只有一行数据，这是const的特例，平时不会出现，因为只有一行信息就不叫大数据了，所以意义不大；

· （2）const

常量查询，表示通过索引Index一次就找到了，用于比较 primary key=常量和 unique=常量这种索引；
如将主键置于where列表中，mysql具有自动转换类型的功能，会自动将该查询转化为一个常量

在这里插入图片描述

d1是虚表，括号具有优先级，首先执行表t1，where id = 1是常量查询const；
虚表d1由于只有一行数据，所以查询类型是系统查询system；

· （3）eq_ref

唯一性索引扫描，对于每个索引键，表中只对应一行数据，常见于主键

在这里插入图片描述

where后面没有括号，MySQL优化器从左到右执行，因此先执行表t2，type是ALL全表查询，对应639行信息；然后查询表
t1，type是eq_ref，表1中id只对应1行信息，唯一索引扫描；

· （4）ref
非唯一索引扫描，对于每个索引键，表中可能对应多行数据；

查询表t1中，不重复的字段col1有7条，其余全是重复的；
满足查询条件col1='ac’的记录有284行，所以是ref非唯一索引扫描；

· （5）range
范围查询，where后面的列表中是between、<、>、in等的查询；

在这里插入图片描述

关键词between，type是range范围查找；

在这里插入图片描述

关键词in，type是range范围查找；
★ 关键词like也是范围查找，后面再写；

· （6）index
全索引扫描，FULL INDEX SCAN，只遍历索引树，通常比ALL快；
（index与ALL都是全表查询，但index是从索引中读取，ALL是从全表中读取）；

· （7）ALL
全表扫描，FULL TABLE SCAN，遍历全表找到匹配的行；速度最慢，避免使用；

4.5. possible_keys

查询的字段上若存在索引，则将索引列出，一个或多个，但不一定在查询时实际使用；

4.6. key

实际使用的索引，若为NULL，则没有使用索引，常见的可能原因：
· （1）没有建索引
· （2）sql语句写法错误，索引失效；
· （3）possible_key也为NULL时，表示用不到索引

4.7. key_len

可以通过key_len看出索引字段的个数，74指1个，78指2个，140指3个；

4.8. ref

显示使用索引的是哪个字段，可以是一个const常量；
ps：type里的ref指非唯一索引扫描，对索引字段，可能存在多个重复值；

在这里插入图片描述

从表t1和表t2中查询所有，查询条件：t1.col1=t2.col1、t1.col2=‘ac’;
同一个where列表中，优化器从右到左执行，索引有两个字段；
优先执行字段值’ac’，是const常量；
然后执行数据库shared中表t2中的字段col1，即shared.t2.col1；

4.9. rows
索引查询时，大致估算出查询到所需记录读取的行数，rows越小越好；

4.10. Extra

额外信息，包含以下三种：
· （1）Using filesort
说明建立的、准备使用的索引index并没有被用到，执行了文件排序；
可能是sql语句写法有问题，与之前建立的索引index冲突了；

· （2）Using temporary
使用了临时表来保存中间结果，说明建立的索引没有使用完全；
常见于排序order by和分组查询group by；

· （3）Using index
select操作中用到了覆盖索引（Covering Index），说明sql执行的效率不错！
覆盖索引（Covering Index）：
eg：先creat一个index，index_字段a_字段b；
然后select 字段a，字段b on table where 字段a=…，字段b=…
即先创建拥有某几个字段的索引，然后查询索引里的字段，where列表是索引字段的值；即当索引字段值为XXX时，查询该字段；这是select效率最高的方式。
··· 若同时出现using where，表明索引被用来执行索引键值的查找；
··· 若没有同时出现using where，表明索引没有用来执行索引键值的查找，只是用来读取数据；