在MySQL的逻辑架构的第二层服务层中有一个优化器(Optimizer),该优化器能以它自己认可的一种方式优化底层MySQL的执行顺序。使用EXPLAIN关键字可以模拟优化器执行SQL查询语句,从而知道MySQL是如何处理SQL语句的。分析查询语句或是表结构的性能瓶颈。
MySQL常见瓶颈
MySQL的常见瓶颈分为以下几类:
- CPU:SQL中对大量数据进行比较、关联、排序、分组(最大的压力在于比较)
- IO:实例内存满足不了缓存数据或排序等需要,导致产生大量物理 IO。查询执行效率低,扫描过多数据行。
- 锁:不适宜的锁的设置,导致线程阻塞,性能下降。死锁,线程之间交叉调用资源,导致死锁,程序卡住。
- 服务器硬件的性能瓶颈:使用top,free, iostat和vmstat来查看系统的性能状态
Explain
Explain用途
先简单看一下Explain的用途,初次看下面罗列的几点你可能并不知道在说啥,但通过接下来的学习,回过头来看时就会明了了。
- 查看表的读取顺序
- 哪些索引可以使用
- 数据读取操作的操作类型
- 哪些索引被实际使用
- 表之间的引用
- 每张表有多少行被优化器查询
Explain使用
语法: Expalin + 一条完整的SQL语句。
如:explain select * from dept;
注意:在5.7以前的版本中,想要显示partitions需要使用explain partitions命令;想要显示filtered需要使用explain extended命令。在5.7版本后,默认explain直接显示partitions和filtered中的信息。
各字段含义
1. id
select查询的序列号,包含一组数字,表示查询中执行select子句或操作表的顺序。执行顺序描述如下:id值相同时,执行顺序由上至下;id值不同时,数字越大的越先执行
。
案例:查看下面的执行语句分析MySQL的执行顺序。
EXPLAIN SELECT t2.* FROM t2, (SELECT * FROM t3 WHERE t3.content='') s3 WHERE s3.id=t2.id;
解释:我们看id列,1,1,2三个数值,数字越大越先执行,2对应的表为t3表,所以先读取t3表,即执行(SELECT * FROM t3 WHERE t3.content=’ '),然后两个1相同,则自上往下顺序执行,先读取derived2即有id为2的衍生出的衍生表s3,最后再读取t2表。(此图为5.5版本)
2. select_type
select_type用来指明查询类型,可能的取值如下:
含义:
- simple:表示不需要union操作或者不包含子查询的简单select查询。有连接查询时,外层的查询为simple,且只有一个。
- primary:一个需要union操作或者含有子查询的select,位于最外层的查询即为primary。且只有一个。
- union:union连接的select查询,除了第一个表外,第二个及以后的表查询都是union。
- dependent union:与union一样,出现在union 或union all语句中,但是这个查询要受到外部查询的影响
- union result:包含union的结果集,在union和union all语句中,因为它不需要参与查询,所以id字段为null
- subquery:除了from子句中包含的子查询外,其他地方出现的子查询都可能是subquery
- dependent subquery:与dependent union类似,表示这个subquery的查询要受到外部表查询的影响
- derived:from子句中出现的子查询。
- materialized:被物化的子查询
- UNCACHEABLE SUBQUERY:对于外层的主表,子查询不可被物化,每次都需要计算(耗时操作)
- UNCACHEABLE UNION:UNION操作中,内层的不可被物化的子查询(类似于UNCACHEABLE SUBQUERY)
3. table
表示这一行的数据是关于哪张表的,可以是真实的表名,也可以是衍生表,如< derived N>表示该表来自于某个查询衍生出来的,后边的N就是执行计划中的id。<union M,N>表示这个结果来自于union查询的id为M,N的结果集。
4. partitions
版本5.7以前,该项是explain partitions显示的选项,5.7以后成为了默认选项。该列显示的为分区表命中的分区情况。非分区表该字段为空(null)。
5. type
type是访问类型,可能的取值按从好到坏的排序依次是:system > const > eq_ref > ref > fulltext > ref_or_null > index_merge > unique_subquery > index_subquery > range(尽量保证) > index > ALL
需要记住的是:system>const>eq_ref>ref>range>index>ALL
一般来说,得保证查询至少达到range级别,最好能达到ref级别
- system:表中只有一行数据,且只能用于myisam和memory表。如果是Innodb引擎表,type列在这个情况通常都是all或者index。这是const类型的特列,平时不会出现,这个也可以忽略不计。
- const:使用主键或者唯一索引(primary key 或者 unique key),只匹配一行数据,也叫做唯一索引扫描。
- eq_ref:唯一性索引扫描,对于每个索引键,表中
只有一条记录
与之匹配。常见于主键或唯一索引扫描,如一个公司的CEO只有一个,对应的部门为总裁办,只有一条记录与之对应。 - ref:非唯一性索引扫描,返回匹配某个单独值的
所有行
。本质上也是一种索引访问,它返回所有匹配某个单独值的行,然而,它可能会找到多个符合条件的行,所以他应该属于查找和扫描的混合体。 - range:只检索给定范围的行,索引范围扫描,常见于使用 =, <>, >, >=, <, <=, IS NULL, <=>, BETWEEN, IN()或者like等运算符的查询中。
- index:Full Index Scan全索引扫描,index与ALL区别为index类型只遍历索引树。这通常比ALL快,因为索引文件通常比数据文件小。(也就是说虽然all和Index都是读全表,但index是从索引中读取的,而all是从硬盘中读取的)
- all:Full Table Scan全表扫描,将遍历全表以找到匹配的行
- index_merge:表示查询使用了两个及以上的索引,通常出现在有 or 的关键字的sql中
- ref_or_null:对于某个字段既需要关联条件,也需要null值得情况下。查询优化器会选择用ref_or_null连接查询。
例如:SELECT * FROM ref_table WHERE key_column=expr OR key_column IS NULL; - unique_subquery:用于where中的in形式子查询,子查询返回不重复值唯一值
- index_subquery:用于in形式子查询使用到了辅助索引或者in常数列表,子查询可能返回重复值,可以使用索引将子查询去重。
6. possible_keys
显示可能应用在这张表中的索引,一个或多个。查询涉及到的字段上若存在索引,则该索引将被列出,但不一定被查询实际使用
7.key
实际使用的索引。如果为NULL,则没有使用索引。查询中若使用了覆盖索引,则该索引和查询的select字段重叠,显示的key为索引名称。
8. key_len
表示索引中使用的字节数,可通过该列计算查询中使用的索引的长度。key_len字段能够帮你检查是否充分的利用上了索引。key_len只计算where条件用到的索引长度,而排序和分组就算用到了索引,也不会计算到key_len中。
9. ref
显示索引的哪一列被使用了,如果可能的话,是一个常数。哪些列或常量被用于查找索引列上的值。
10.rows
rows列显示MySQL认为它执行查询时必须检查的行数。估算出的行数值,不是精确值。行数越少越好。
11. filtered
使用explain extended时会出现这个列,5.7之后的版本默认就有这个字段,不需要使用explain extended了。这个字段表示存储引擎返回的数据在server层过滤后,剩下多少满足查询的记录数量的比例,注意是百分比,不是具体记录数。
12. extra
包含不适合在其他列中显示但十分重要的额外信息。
这一列可以显示的信息有:
- using filesort:说明mysql会对数据使用一个外部的索引排序,而不是按照表内的索引顺序进行读取。
MySQL中无法利用索引完成的排序操作称为“文件排序”。 - using temporary:使用了临时表保存中间结果,MySQL在对查询结果排序时使用临时表。常见于排序
order by
和分组查询group by
。 - using index:表示相应的select操作中使用了覆盖索引(Covering Index),避免访问了表的数据行,效率不错!如果同时出现using where,表明索引被用来执行索引键值的查找;
如果没有同时出现using where,表明索引只是用来读取数据而非利用索引执行查找。 - using where:表明使用了where过滤
- using join buffer:使用了连接缓存
- impossible where:where子句的值总是false,不能用来获取任何元组
注意:若出现上述红色的提示信息,则需要对查询语句进行相应的优化了。