（二）MySQL高级——explain

一、Explain是什么？

查询执行计划。使用EXPLAIN关键字可以模拟优化器执行sql查询语句，从而得知MySQL是如何处理写好的sql语句的。分析这些查询语句或是表结构的性能瓶颈。

二、Explain能做什么？

查看表的读取顺序、数据读取操作的操作类型，发现哪些索引是可以使用的，哪些又是被实际使用到的，可以查出表之间的引用，甚至能够知道每张表有多少行被优化器查询。

三、Explain怎么使用？

格式为：Explain关键字 + SQL语句。

执行计划包含的信息：id、select_type、table、type、possible_keys、key、key_len、ref、rows、Extra。

四、各字段解释

1、执行计划包含的信息之id，相当于是表的读取顺序。

select查询的序列号，包含一组数字，表示查询中执行select子句或操作表的顺序。

三种情况：

（1）id相同，执行顺序由上至下。下图执行顺序为： t1 ---> t2 ---> t3

（2）id不同，如果是子查询，id的序号会递增，id值越大优先级越高，越先被执行。下图执行顺序为： t3 ---> t1 ---> t2

（3）id相同和不相同的同时存在。id如果相同，可以认为是一组，从上往下顺序执行；在所有组中，id值越大，优先级越高，越先执行。下图执行顺序为： t3 ---> t1 ---> t2

2、执行计划包含的信息之select_type，相当于是数据读取操作的操作类型。

有六种操作类型：SIMPLE、PRIMARY、SUBQUERY、DERIVED、UNION、UNION RESULT

6种类型具体介绍：

（1）SIMPLE：简单的select查询，查询中不包含子查询或者UNION

（2）PRIMARY：查询中若包含任何复杂的子查询，最外层查询标记为PRIMARY

（3）SUBQUERY：在SELECT或WHERE列表中包含了子查询，该子查询则被标记为SUBQUERY

（4）DERIVED：在FROM列表中包含的子查询被标记为DERIVED（意思为：衍生），MySQL会递归执行这些子查询，把结果放在临时表里。

（5）UNION：若第二个SELECT出现在UNION之后，则被标记为UNION；若UNION包含在FROM子句的子查询中，外层SELECT将被标记为：DERIVED（衍生）。

（6）UNION RESULT：从UNION表获取结果的SELECT

3、执行计划包含的信息之table。

显示这一行的数据是关于那张表的。

4、执行计划包含的信息之type，相当于是显示查询语句使用了哪种访问类型去访问数据库。

type的分类：ALL、index、range、ref、eq_ref、const，system、NULL

type显示的是访问类型那么，是较为重要的一个指标，常见值从最好到最差顺序依次为system > const > eq_ref > ref > range > index > ALL 。一般来说，要保证查询至少达到 range 级别，最好则是要能达到 ref 级别。

（1）system ：表只有一行记录（相当于系统表），这是const类型的特例，平时不会出现，也可以忽略不计。

（2）const ：意思为常量。表示通过索引一次就找到了，const用于比较primary key或者unique索引。因为只匹配一行数据，所以会很快。例如：将主键置于where列表中，MySQL就能将该查询转换为一个常量。

（3）eq_ref ：唯一性索引扫描，对于每个索引键，表中只有一条记录与之匹配。常见于主键或唯一索引扫描。

比如查询一个公司的CEO，只有一个值与之对应。

（4）ref ：非唯一性索引扫描，返回匹配某个单独值的所有行。本质上也是一种索引访问，它返回所有匹配某个单独值的行，然而它可能会找到多个符合条件的行，所以他应该属于查找和扫描的混合体。

比如查询一个公司技术部门的普通职工，那么会有多个值符合条件。

（5） range ：只检索给定范围的行，使用一个索引来选择行。key列显示使用了哪个索引，一般就是在where语句中表现出了between and、< 、> 、in 等的查询。这种范围扫描索引比全表扫描要好，因为他只需要开始于索引的某一点，结束于另一点，不用扫描全部索引。

（6）index ：FULL Index Scan，index于ALL区别为——index类型值遍历索引数。这通常比ALL快，因为索引文件通常比数据文件小。也就是说虽然ALL和Index都是读全表，但是index是从索引中读取的，而ALL是从硬盘中读取的。

（7）ALL：FULL Table Scan，将遍历全表来找到匹配的行。

5、执行计划包含的信息之possible_keys，就是相当于发现哪些索引是可以使用的。

显示可能应用在这张表中的索引，一个或多个。查询涉及到的字段上若存在索引，那么该索引将会被罗列出，但是不一定被查询实际使用到。

6、执行计划包含的信息之key，就是相当于哪些索引是被实际使用到的。

实际使用的索引。如果为NULL，则没有使用到索引。查询中若使用了覆盖索引，那么该索引只会出现在key列表中。

覆盖索引：指select后面查询的字段和索引创建的字段在个数上、顺序上是完全一致的。联系上下图可知，那么此时就可以从索引上扫描，而不用全表扫描了。所以possible_keys为NULL，但key上表名实际用到却是有索引的。

7、执行计划包含的信息之key_len

表示索引中使用的字节数，可通过该列计算，得知查询中使用的索引的长度。在不损失精确性的情况下，长度越短越好。key_len显示的值为索引字段的最大可能长度，并非实际使用长度，即key_len是根据表定义计算而得到的，不是通过表内检索出来的。下图的对比就是要理解，在同样的查询效果下，长度越小越好。

8、执行计划包含的信息之ref，相当于可以查出表之间的引用。

显示索引的哪一列被使用了，如果可能的话，会是一个常数。哪些列或常量被用与查找索引列上的值。比如说下图ref中包含的依次是：shared数据库下t2表里的col1的字段，以及常量const。

查询中与其他表关联的字段，外键关系建立索引。

9、执行计划包含的信息之rows，相当于可以知道每张表有多少行被优化器查询过。

根据表统计信息及索引选用情况，大致估算出找到所需的记录、所需要读取的行数。

下图是没建立索引的时候rows总和为：640+1=641。

建立复合索引之后，可以发下rows总和大大减少，变为：142+1=143。上下两个图的对比可以知道，建立索引之后的优化效果就很明显了。所以rows代表的值越小越好。

10、执行计划包含的信息之Extra

包含不适合在其他列中显示但十分重要的额外信息，有以下几个分类：Using filesort、Using temporary、Using index、Using where、Using join buffer、impossible where、select tables optimized away、distinct。

（1）Using filesort：说明MySQL会对数据使用一个外部的索引排序，而不是按照表内的索引顺序进行读取。换句话说，就是MySQL中无法利用索引完成的排序操作称为“文件排序”。下图的案例就表示了这个复合索引，在查询上是被使用到了，但是在排序上并没有使用到。

添加上col2，使排序完整。那么效果如下图所示，就没有using filesort了。这样效率是更高的。

（2）Using temporary：使用了临时表保存中间结果，MySQL在对查询结果排序时使用临时表。常见于排序order by和分组查询group by。像下图这种情况就是复合索引跟group by后面不一致的情况，会出现Using temporary的状况。

但如果把group by 后面添加上col1，保持和用到的复合索引一致，那么就不会出现上述情况了。应该避免出现创建零时表的情况，会增加数据库的负担。

（3）Using index：表示相应的select操作中使用了覆盖索引（Covering Index），避免访问了表的数据行，效果不错！如果同时出现using where，表明索引被用来执行索引键值的查找；如果没有同时出现using where，表明索引用来读取数据而非执行查找动作。

覆盖索引的理解一（推荐）：就是select的数据列只用从索引中就能够取得，不必读取数据行，MySQL可以利用索引返回select列表中的字段，而不必根据索引再次读取数据文件，换句话说就是查询列要被所建立的索引覆盖。

覆盖索引的理解二：索引是高效找到行的一个方法，但是一般数据库也能使用索引找到一个列的数据，因此它不必读取整个行。毕竟索引叶子节点存储了它们索引的数据；当能通过读取索引就能得到想到的数据时，那就不需要读取行了。一个索引包含了（或覆盖了）满足查询结果的数据就叫做覆盖索引。

但都要注意的是：如果要使用覆盖索引，一定要注意select列表中之取出需要的列就行，不可以select * ；因为如果将所有字段一起做索引会导致索引文件过大，查询性能下降。

（4）Using where：表明适用了where过滤。

（5）Using join buffer：使用了连接缓存。

（6）impossible where：where子句的值总是false，不能用来获取任何元组，如下图所示。

（7）select tables optimized away：在没有group by子句的情况下，基于索引优化MIN/MAX操作或者对于MyISAM存储引擎优化COUNT(*)操作，不必等到执行阶段再进行计算，查询执行计划生成的阶段即完成优化。

（8）distinct：优化distinct操作，在找到第一匹配的元组后就停止找同样值的操作。

最重要的是前三个，后面的就是一些少见或者能见名知意的。

（二）MySQL高级——explain

猜你喜欢