MySQL高级(三)、使用Explain进行SQL性能分析

在MySQL的逻辑架构的第二层服务层中有一个优化器(Optimizer),该优化器能以它自己认可的一种方式优化底层MySQL的执行顺序。使用EXPLAIN关键字可以模拟优化器执行SQL查询语句,从而知道MySQL是如何处理SQL语句的。分析查询语句或是表结构的性能瓶颈。

MySQL常见瓶颈

MySQL的常见瓶颈分为以下几类:

  • CPU:SQL中对大量数据进行比较、关联、排序、分组(最大的压力在于比较)
  • IO:实例内存满足不了缓存数据或排序等需要,导致产生大量物理 IO。查询执行效率低,扫描过多数据行。
  • 锁:不适宜的锁的设置,导致线程阻塞,性能下降。死锁,线程之间交叉调用资源,导致死锁,程序卡住。
  • 服务器硬件的性能瓶颈:使用top,free, iostat和vmstat来查看系统的性能状态

Explain

Explain用途

先简单看一下Explain的用途,初次看下面罗列的几点你可能并不知道在说啥,但通过接下来的学习,回过头来看时就会明了了。

  1. 查看表的读取顺序
  2. 哪些索引可以使用
  3. 数据读取操作的操作类型
  4. 哪些索引被实际使用
  5. 表之间的引用
  6. 每张表有多少行被优化器查询

Explain使用

语法: Expalin + 一条完整的SQL语句。
如:explain select * from dept;
在这里插入图片描述

注意:在5.7以前的版本中,想要显示partitions需要使用explain partitions命令;想要显示filtered需要使用explain extended命令。在5.7版本后,默认explain直接显示partitions和filtered中的信息。

各字段含义

1. id

select查询的序列号,包含一组数字,表示查询中执行select子句或操作表的顺序。执行顺序描述如下:id值相同时,执行顺序由上至下;id值不同时,数字越大的越先执行
案例:查看下面的执行语句分析MySQL的执行顺序。

EXPLAIN SELECT t2.* FROM t2, (SELECT * FROM t3 WHERE t3.content='') s3 WHERE s3.id=t2.id;

在这里插入图片描述
解释:我们看id列,1,1,2三个数值,数字越大越先执行,2对应的表为t3表,所以先读取t3表,即执行(SELECT * FROM t3 WHERE t3.content=’ '),然后两个1相同,则自上往下顺序执行,先读取derived2即有id为2的衍生出的衍生表s3,最后再读取t2表。(此图为5.5版本)

2. select_type

select_type用来指明查询类型,可能的取值如下:
在这里插入图片描述
含义:

  • simple:表示不需要union操作或者不包含子查询的简单select查询。有连接查询时,外层的查询为simple,且只有一个。
  • primary:一个需要union操作或者含有子查询的select,位于最外层的查询即为primary。且只有一个。
  • union:union连接的select查询,除了第一个表外,第二个及以后的表查询都是union。
  • dependent union:与union一样,出现在union 或union all语句中,但是这个查询要受到外部查询的影响
  • union result:包含union的结果集,在union和union all语句中,因为它不需要参与查询,所以id字段为null
  • subquery:除了from子句中包含的子查询外,其他地方出现的子查询都可能是subquery
  • dependent subquery:与dependent union类似,表示这个subquery的查询要受到外部表查询的影响
  • derived:from子句中出现的子查询。
  • materialized:被物化的子查询
  • UNCACHEABLE SUBQUERY:对于外层的主表,子查询不可被物化,每次都需要计算(耗时操作)
  • UNCACHEABLE UNION:UNION操作中,内层的不可被物化的子查询(类似于UNCACHEABLE SUBQUERY)

3. table

表示这一行的数据是关于哪张表的,可以是真实的表名,也可以是衍生表,如< derived N>表示该表来自于某个查询衍生出来的,后边的N就是执行计划中的id。<union M,N>表示这个结果来自于union查询的id为M,N的结果集。

4. partitions

版本5.7以前,该项是explain partitions显示的选项,5.7以后成为了默认选项。该列显示的为分区表命中的分区情况。非分区表该字段为空(null)。

5. type

type是访问类型,可能的取值按从好到坏的排序依次是:system > const > eq_ref > ref > fulltext > ref_or_null > index_merge > unique_subquery > index_subquery > range(尽量保证) > index > ALL

需要记住的是:system>const>eq_ref>ref>range>index>ALL
一般来说,得保证查询至少达到range级别,最好能达到ref级别

  • system:表中只有一行数据,且只能用于myisam和memory表。如果是Innodb引擎表,type列在这个情况通常都是all或者index。这是const类型的特列,平时不会出现,这个也可以忽略不计。
  • const:使用主键或者唯一索引(primary key 或者 unique key),只匹配一行数据,也叫做唯一索引扫描。
  • eq_ref:唯一性索引扫描,对于每个索引键,表中只有一条记录与之匹配。常见于主键或唯一索引扫描,如一个公司的CEO只有一个,对应的部门为总裁办,只有一条记录与之对应。
  • ref:非唯一性索引扫描,返回匹配某个单独值的所有行。本质上也是一种索引访问,它返回所有匹配某个单独值的行,然而,它可能会找到多个符合条件的行,所以他应该属于查找和扫描的混合体。
  • range:只检索给定范围的行,索引范围扫描,常见于使用 =, <>, >, >=, <, <=, IS NULL, <=>, BETWEEN, IN()或者like等运算符的查询中。
  • index:Full Index Scan全索引扫描,index与ALL区别为index类型只遍历索引树。这通常比ALL快,因为索引文件通常比数据文件小。(也就是说虽然all和Index都是读全表,但index是从索引中读取的,而all是从硬盘中读取的)
  • all:Full Table Scan全表扫描,将遍历全表以找到匹配的行
  • index_merge:表示查询使用了两个及以上的索引,通常出现在有 or 的关键字的sql中
  • ref_or_null:对于某个字段既需要关联条件,也需要null值得情况下。查询优化器会选择用ref_or_null连接查询。
    例如:SELECT * FROM ref_table WHERE key_column=expr OR key_column IS NULL;
  • unique_subquery:用于where中的in形式子查询,子查询返回不重复值唯一值
  • index_subquery:用于in形式子查询使用到了辅助索引或者in常数列表,子查询可能返回重复值,可以使用索引将子查询去重。

6. possible_keys

显示可能应用在这张表中的索引,一个或多个。查询涉及到的字段上若存在索引,则该索引将被列出,但不一定被查询实际使用

7.key

实际使用的索引。如果为NULL,则没有使用索引。查询中若使用了覆盖索引,则该索引和查询的select字段重叠,显示的key为索引名称。

8. key_len

表示索引中使用的字节数,可通过该列计算查询中使用的索引的长度。key_len字段能够帮你检查是否充分的利用上了索引。key_len只计算where条件用到的索引长度,而排序和分组就算用到了索引,也不会计算到key_len中。

9. ref

显示索引的哪一列被使用了,如果可能的话,是一个常数。哪些列或常量被用于查找索引列上的值。
在这里插入图片描述

10.rows

rows列显示MySQL认为它执行查询时必须检查的行数。估算出的行数值,不是精确值。行数越少越好。

11. filtered

使用explain extended时会出现这个列,5.7之后的版本默认就有这个字段,不需要使用explain extended了。这个字段表示存储引擎返回的数据在server层过滤后,剩下多少满足查询的记录数量的比例,注意是百分比,不是具体记录数。

12. extra

包含不适合在其他列中显示但十分重要的额外信息。
这一列可以显示的信息有:

  1. using filesort:说明mysql会对数据使用一个外部的索引排序,而不是按照表内的索引顺序进行读取。
    MySQL中无法利用索引完成的排序操作称为“文件排序”。
  2. using temporary:使用了临时表保存中间结果,MySQL在对查询结果排序时使用临时表。常见于排序 order by 和分组查询 group by
  3. using index:表示相应的select操作中使用了覆盖索引(Covering Index),避免访问了表的数据行,效率不错!如果同时出现using where,表明索引被用来执行索引键值的查找;
    如果没有同时出现using where,表明索引只是用来读取数据而非利用索引执行查找。
  4. using where:表明使用了where过滤
  5. using join buffer:使用了连接缓存
  6. impossible where:where子句的值总是false,不能用来获取任何元组

注意:若出现上述红色的提示信息,则需要对查询语句进行相应的优化了。

猜你喜欢

转载自blog.csdn.net/shao_yc/article/details/106418849
今日推荐