(二)MySQL高级——explain

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/Steriles_/article/details/84069298

一、Explain是什么?

查询执行计划。使用EXPLAIN关键字可以模拟优化器执行sql查询语句,从而得知MySQL是如何处理写好的sql语句的。分析这些查询语句或是表结构的性能瓶颈。

二、Explain能做什么?

查看表的读取顺序、数据读取操作的操作类型,发现哪些索引是可以使用的,哪些又是被实际使用到的,可以查出表之间的引用,甚至能够知道每张表有多少行被优化器查询。

三、Explain怎么使用?

格式为:Explain关键字  +  SQL语句。

执行计划包含的信息:id、select_type、table、type、possible_keys、key、key_len、ref、rows、Extra。

四、各字段解释

1、执行计划包含的信息之id,相当于是表的读取顺序。

select查询的序列号,包含一组数字,表示查询中执行select子句或操作表的顺序。

三种情况:

(1)id相同,执行顺序由上至下。下图执行顺序为: t1 ---> t2 ---> t3

(2)id不同,如果是子查询,id的序号会递增,id值越大优先级越高,越先被执行。下图执行顺序为: t3 ---> t1 ---> t2

(3)id相同和不相同的同时存在。id如果相同,可以认为是一组,从上往下顺序执行;在所有组中,id值越大,优先级越高,越先执行。下图执行顺序为: t3 ---> t1 ---> t2

2、执行计划包含的信息之select_type,相当于是数据读取操作的操作类型。

有六种操作类型:SIMPLE、PRIMARY、SUBQUERY、DERIVED、UNION、UNION   RESULT

6种类型具体介绍:

(1)SIMPLE:简单的select查询,查询中不包含子查询或者UNION

(2)PRIMARY:查询中若包含任何复杂的子查询,最外层查询标记为PRIMARY

(3)SUBQUERY:在SELECT或WHERE列表中包含了子查询,该子查询则被标记为SUBQUERY

(4)DERIVED:在FROM列表中包含的子查询被标记为DERIVED(意思为:衍生),MySQL会递归执行这些子查询,把结果放在临时表里。

(5)UNION:若第二个SELECT出现在UNION之后,则被标记为UNION;若UNION包含在FROM子句的子查询中,外层SELECT将被标记为:DERIVED(衍生)。

(6)UNION   RESULT:从UNION表获取结果的SELECT

3、执行计划包含的信息之table。

显示这一行的数据是关于那张表的。

4、执行计划包含的信息之type,相当于是显示查询语句使用了哪种访问类型去访问数据库。

type的分类:ALL、index、range、ref、eq_ref、const,system、NULL

type显示的是访问类型那么,是较为重要的一个指标,常见值从最好到最差顺序依次为system > const > eq_ref > ref > range > index > ALL 。一般来说,要保证查询至少达到 range 级别,最好则是要能达到 ref 级别。

(1)system :表只有一行记录(相当于系统表),这是const类型的特例,平时不会出现,也可以忽略不计。

(2)const :意思为常量。表示通过索引一次就找到了,const用于比较primary key或者unique索引。因为只匹配一行数据,所以会很快。例如:将主键置于where列表中,MySQL就能将该查询转换为一个常量。

(3)eq_ref :唯一性索引扫描,对于每个索引键,表中只有一条记录与之匹配。常见于主键或唯一索引扫描。

比如查询一个公司的CEO,只有一个值与之对应。

(4)ref :非唯一性索引扫描,返回匹配某个单独值的所有行。本质上也是一种索引访问,它返回所有匹配某个单独值的行,然而它可能会找到多个符合条件的行,所以他应该属于查找和扫描的混合体。

比如查询一个公司技术部门的普通职工,那么会有多个值符合条件。

(5) range :只检索给定范围的行,使用一个索引来选择行。key列显示使用了哪个索引,一般就是在where语句中表现出了between   and、< 、> 、in 等的查询。这种范围扫描索引比全表扫描要好,因为他只需要开始于索引的某一点,结束于另一点,不用扫描全部索引。

(6)index :FULL   Index  Scan,index于ALL区别为——index类型值遍历索引数。这通常比ALL快,因为索引文件通常比数据文件小。也就是说虽然ALL和Index都是读全表,但是index是从索引中读取的,而ALL是从硬盘中读取的。

(7)ALL:FULL  Table  Scan,将遍历全表来找到匹配的行。

5、执行计划包含的信息之possible_keys,就是相当于发现哪些索引是可以使用的。

显示可能应用在这张表中的索引,一个或多个。查询涉及到的字段上若存在索引,那么该索引将会被罗列出,但是不一定被查询实际使用到。

6、执行计划包含的信息之key,就是相当于哪些索引是被实际使用到的。

实际使用的索引。如果为NULL,则没有使用到索引。查询中若使用了覆盖索引,那么该索引只会出现在key列表中。

覆盖索引:指select后面查询的字段和索引创建的字段在个数上、顺序上是完全一致的。联系上下图可知,那么此时就可以从索引上扫描,而不用全表扫描了。所以possible_keys为NULL,但key上表名实际用到却是有索引的。

7、执行计划包含的信息之key_len

表示索引中使用的字节数,可通过该列计算,得知查询中使用的索引的长度。在不损失精确性的情况下,长度越短越好。key_len显示的值为索引字段的最大可能长度并非实际使用长度,即key_len是根据表定义计算而得到的,不是通过表内检索出来的。下图的对比就是要理解,在同样的查询效果下,长度越小越好。

8、执行计划包含的信息之ref,相当于可以查出表之间的引用。

显示索引的哪一列被使用了,如果可能的话,会是一个常数。哪些列或常量被用与查找索引列上的值。比如说下图ref中包含的依次是:shared数据库下t2表里的col1的字段,以及常量const。

查询中与其他表关联的字段,外键关系建立索引。

9、执行计划包含的信息之rows,相当于可以知道每张表有多少行被优化器查询过。

根据表统计信息及索引选用情况,大致估算出找到所需的记录、所需要读取的行数。

下图是没建立索引的时候rows总和为:640+1=641。

建立复合索引之后,可以发下rows总和大大减少,变为:142+1=143。上下两个图的对比可以知道,建立索引之后的优化效果就很明显了。所以rows代表的值越小越好。

10、执行计划包含的信息之Extra

包含不适合在其他列中显示但十分重要的额外信息,有以下几个分类:Using  filesort、Using  temporary、Using  index、Using  where、Using  join  buffer、impossible  where、select  tables  optimized  away、distinct。

(1)Using  filesort:说明MySQL会对数据使用一个外部的索引排序,而不是按照表内的索引顺序进行读取。换句话说,就是MySQL中无法利用索引完成的排序操作称为“文件排序”。下图的案例就表示了这个复合索引,在查询上是被使用到了,但是在排序上并没有使用到。

添加上col2,使排序完整。那么效果如下图所示,就没有using filesort了。这样效率是更高的。

(2)Using  temporary:使用了临时表保存中间结果,MySQL在对查询结果排序时使用临时表。常见于排序order  by和分组查询group by。像下图这种情况就是复合索引跟group  by后面不一致的情况,会出现Using  temporary的状况。

但如果把group by 后面添加上col1,保持和用到的复合索引一致,那么就不会出现上述情况了。应该避免出现创建零时表的情况,会增加数据库的负担。

(3)Using  index:表示相应的select操作中使用了覆盖索引(Covering Index),避免访问了表的数据行,效果不错!如果同时出现using  where,表明索引被用来执行索引键值的查找;如果没有同时出现using  where,表明索引用来读取数据而非执行查找动作。

覆盖索引的理解一(推荐):就是select的数据列只用从索引中就能够取得,不必读取数据行,MySQL可以利用索引返回select列表中的字段,而不必根据索引再次读取数据文件,换句话说就是查询列要被所建立的索引覆盖

覆盖索引的理解二:索引是高效找到行的一个方法,但是一般数据库也能使用索引找到一个列的数据,因此它不必读取整个行。毕竟索引叶子节点存储了它们索引的数据;当能通过读取索引就能得到想到的数据时,那就不需要读取行了。一个索引包含了(或覆盖了)满足查询结果的数据就叫做覆盖索引。

但都要注意的是:如果要使用覆盖索引,一定要注意select列表中之取出需要的列就行,不可以select * ;因为如果将所有字段一起做索引会导致索引文件过大,查询性能下降。

(4)Using  where:表明适用了where过滤。

(5)Using  join  buffer:使用了连接缓存。

(6)impossible  where:where子句的值总是false,不能用来获取任何元组,如下图所示。

(7)select  tables  optimized  away:在没有group by子句的情况下,基于索引优化MIN/MAX操作或者对于MyISAM存储引擎优化COUNT(*)操作,不必等到执行阶段再进行计算,查询执行计划生成的阶段即完成优化。

(8)distinct:优化distinct操作,在找到第一匹配的元组后就停止找同样值的操作。

最重要的是前三个,后面的就是一些少见或者能见名知意的。

 

 

 

猜你喜欢

转载自blog.csdn.net/Steriles_/article/details/84069298