MySQL(高级、面试) —— (MySQL优化 一)Explain 详解

目录

 一. EXPLAIN是干啥的   使用EXPLAIN关键字可以模拟优化器执行SQL查询语句,从而知道MySQL是如何处理你的SQL语句的。分析你的查询语句或是表结构的性能瓶颈。

二、Explain的作用

三、Explain 各字段的含义及其作用 

三、SQL 执行顺序

四、说人话----Explain各字段意思的案例分析

4.1、id

4.2、select_type 

4.3、 table

4.4、 type

4.5. possible_keys

4.6. key

4.7. key_len

4.8. ref

4.9. rows索引查询时,大致估算出查询到所需记录读取的行数,rows越小越好;

4.10. Extra



 一. EXPLAIN是干啥的
   使用EXPLAIN关键字可以模拟优化器执行SQL查询语句,从而知道MySQL是如何处理你的SQL语句的。分析你的查询语句或是表结构的性能瓶颈。

二、Explain的作用

当然是指导我们写出更加优秀的sql语句,提高查询速度。其实说白了就是,让我们写的查询sql尽可能的使用索引,查询的数据总数尽可能的少,从而提高查询速度。

 通过在select+sql语句前加上explain,我们可以看出:
(1)表的读取顺序,id(table是id对应的表)
(2)数据读取操作的操作类型,select type
(3)哪些索引可以使用,possible_keys
(4)哪些索引被实际使用,key
(5)表之间的引用,ref
(6)每张表有多少行被优化器查询,rows

三、Explain 各字段的含义及其作用 

Explain各字段的解释
序号 字段名 字段作用描述
1 id 查询的序号,包含一组数字,表示查询中执行select子句或操作表的顺序
**两种情况**
id相同,执行顺序从上往下
id不同,id值越大,优先级越高,越先执行
2 select_type 查询类型,主要用于区别普通查询,联合查询,子查询等的复杂查询
1、simple ——简单的select查询,查询中不包含子查询或者UNION
2、primary ——查询中若包含任何复杂的子部分,最外层查询被标记
3、subquery——在select或where列表中包含了子查询
4、derived——在from列表中包含的子查询被标记为derived(衍生),MySQL会递归执行这些子查询,把结果放到临时表中
5、union——如果第二个select出现在UNION之后,则被标记为UNION,如果union包含在from子句的子查询中,外层select被标记为derived
6、union result:UNION 的结果
3 table 输出的行所引用的表
4 type

显示联结类型,显示查询使用了何种类型,按照从最佳到最坏类型排序
1、system:表中仅有一行(=系统表)这是const联结类型的一个特例。
2、const:表示通过索引一次就找到,const用于比较primary key或者unique索引。因为只匹配一行数据,所以如果将主键置于where列表中,mysql能将该查询转换为一个常量
3、eq_ref:唯一性索引扫描,对于每个索引键,表中只有一条记录与之匹配。常见于唯一索引或者主键扫描
4、ref:非唯一性索引扫描,返回匹配某个单独值的所有行,本质上也是一种索引访问,它返回所有匹配某个单独值的行,可能会找多个符合条件的行,属于查找和扫描的混合体
5、range:只检索给定范围的行,使用一个索引来选择行。key列显示使用了哪个索引,一般就是where语句中出现了between,in等范围的查询。这种范围扫描索引扫描比全表扫描要好,因为它开始于索引的某一个点,而结束另一个点,不用全表扫描
6、index:index 与all区别为index类型只遍历索引树。通常比all快,因为索引文件比数据文件小很多。
7、all:遍历全表以找到匹配的行

system > const > eq_ref > ref > range > index > all


注意:一般保证查询至少达到range级别,最好能达到ref。

5 possible_keys 指出MySQL能使用哪个索引在该表中找到(可能使用到的索引)
6 key 显示MySQL实际决定使用的键(索引)。如果没有选择索引,键是NULL。查询中如果使用覆盖索引,则该索引和查询的select字段重叠。
7 key_len 表示索引中使用的字节数,该列计算查询中使用的索引的长度在不损失精度的情况下,长度越短越好。如果键是NULL,则长度为NULL。该字段显示为索引字段的最大可能长度,并非实际使用长度。
8 ref 显示索引的哪一列被使用了,如果有可能是一个常数,哪些列或常量被用于查询索引列上的值
9 rows 根据表统计信息以及索引选用情况,大致估算出找到所需的记录所需要读取的行数
10 Extra 包含不适合在其他列中显示,但是十分重要的额外信息
1、Using filesort:说明mysql会对数据适用一个外部的索引排序。而不是按照表内的索引顺序进行读取。MySQL中无法利用索引完成排序操作称为“文件排序”
2、Using temporary:使用了临时表保存中间结果,mysql在查询结果排序时使用临时表。常见于排序order by和分组查询group by。
3、Using index:表示相应的select操作用使用覆盖索引,避免访问了表的数据行。如果同时出现using where,表名索引被用来执行索引键值的查找;如果没有同时出现using where,表名索引用来读取数据而非执行查询动作。
4、Using where :表明使用where过滤
5、using join buffer:使用了连接缓存
6、impossible where:where子句的值总是false,不能 用来获取任何元组
7、select tables optimized away:在没有group by子句的情况下,基于索引优化Min、max操作或者对于MyISAM存储引擎优化count(*),不必等到执行阶段再进行计算,查询执行计划生成的阶段即完成优化。
8、distinct:优化distinct操作,在找到第一匹配的元组后即停止找同样值的动作。


 

三、SQL 执行顺序

     想要优化SQL,必须清楚知道SQL的执行顺序,这样再配合explain才能事半功倍!

3.1、完整SQL语句

select distinct 
        <select_list>
from
    <left_table><join_type>
join <right_table> on <join_condition>
where
    <where_condition>
group by
    <group_by_list>
having
    <having_condition>
order by
    <order_by_condition>
limit <limit number>

3.2 SQL执行顺序
 

1、from <left_table><join_type>
2、on <join_condition>
3、<join_type> join <right_table>
4、where <where_condition>
5、group by <group_by_list>
6、having <having_condition>
7、select
8、distinct <select_list>
9、order by <order_by_condition>
10、limit <limit_number>

四、说人话----Explain各字段意思的案例分析

4.1、id

select查询的数字序列号,表示查询中执行select子句、或多表联合查询时操作表的顺序
· (1)id相同,执行顺序由上至下

从t1、t2、t3三张表中查询t2表的全部,查询条件是:t1.id=t2.id 、t1.id=t3.id、t1的其他字段是空;
优化器对于同一个where内部的条件,默认是从右往左读取的;
所以三张表的执行顺序是:t1 -> t3 -> t2;

(2)id不同,id越大执行优先级越高

如果是子查询,id的序列号会递增,越是在里面的子查询越优先执行,类似于递归的思想;( )里的语句具有优先级

从t2表中查询t2表的全部,查询条件是id,查询条件是三层嵌套:
从表t1查询id——id是从表t3中查询到的t3表的id——t3表的其他字段为空;
用递归的思想,很容易判断,表的执行顺序:t3 -> t1 -> t2

(3)id同时存在相同和不同的情况,id不同的id大的优先执行,id相同的从上到下执行

这里需要引入一个概念,衍生虚表查询(Derived):
从原表中截取部分信息,组成的结果集可以构成一张新表,这张表并不实际存在,作为一张虚表被调用;这种查询就叫衍生虚表查询;

(从表t3中查询t3表的id,查询条件是其他字段为空)将括号中t3表的查询条件,的结果集作为一张虚表s1,
从虚表s1、表t2中,查询表t2的全部,查询条件是s1.id=t2.id;
所以,查询的顺序是:t3 -> derived2 -> t2
derived2指,由id=2时,即表t3的结果集衍生构成的虚表s1;

4.2、select_type 

查询的类型,一共有以下6种表的查询类型:

· (1)SIMPLE
简单查询,查询中不包含子查询、union(联合查询);

· (2)PRIMARY
查询中若包含子查询,则最外层查询被标记为PRIMARY;

· (3)SUBQUERY
在select或where列表中的子查询

· (4)DERIVED
典型语法:from ( 子查询 ) s1,
在from列表中包含的子查询,被标记为DERIVED(衍生),这个子查询执行后的结果集放在一张虚表s1中;

· (5)UNION
若第二条select出现在union之后,则标记为union联合多表查询;
若union包含在from字句的查询中,即select 属性 from(子查询1 union 子查询2)s1,这种外层的select被标记为DERIVED;

· (6)UNION RESULT
从UNION表中获取结果的SELECT 

4.3、 table

 指id对应的表,通过id判断表的执行顺序;
也指这一行的数据是关于哪张表的;

4.4、 type

 显示查询时,使用了哪种查询类型,日常工作中经常接触到的有以下7种,性能由最好到最差依次是:
system > const > eq_ref > ref > range > index > ALL
一般需要保证查询类型等级达到range,最好能达到ref,避免使用ALL。

· (1)system
系统查询,指表中只有一行数据,这是const的特例,平时不会出现,因为只有一行信息就不叫大数据了,所以意义不大;

· (2)const

常量查询,表示通过索引Index一次就找到了,用于比较 primary key=常量 和 unique=常量 这种索引;
如将主键置于where列表中,mysql具有自动转换类型的功能,会自动将该查询转化为一个常量

在这里插入图片描述

 d1是虚表,括号具有优先级,首先执行表t1,where id = 1是常量查询const;
虚表d1由于只有一行数据,所以查询类型是系统查询system;

· (3)eq_ref

唯一性索引扫描,对于每个索引键,表中只对应一行数据,常见于主键

在这里插入图片描述

 where后面没有括号,MySQL优化器从左到右执行,因此先执行表t2,type是ALL全表查询,对应639行信息;然后查询表
t1,type是eq_ref,表1中id只对应1行信息,唯一索引扫描;

· (4)ref
非唯一索引扫描,对于每个索引键,表中可能对应多行数据;

 查询表t1中,不重复的字段col1有7条,其余全是重复的;
满足查询条件col1='ac’的记录有284行,所以是ref非唯一索引扫描;

 · (5)range
范围查询,where后面的列表中是between、<、>、in等的查询;

在这里插入图片描述

 关键词between,type是range范围查找;

在这里插入图片描述

关键词in,type是range范围查找;
★ 关键词like也是范围查找,后面再写;

· (6)index
全索引扫描,FULL INDEX SCAN,只遍历索引树,通常比ALL快;
(index与ALL都是全表查询,但index是从索引中读取,ALL是从全表中读取);

· (7)ALL
全表扫描,FULL TABLE SCAN,遍历全表找到匹配的行;速度最慢,避免使用;

4.5. possible_keys

 查询的字段上若存在索引,则将索引列出,一个或多个,但不一定在查询时实际使用;

4.6. key

 实际使用的索引,若为NULL,则没有使用索引,常见的可能原因:
· (1)没有建索引
· (2)sql语句写法错误,索引失效;
· (3)possible_key也为NULL时,表示用不到索引

4.7. key_len

可以通过key_len看出索引字段的个数,74指1个,78指2个,140指3个;

4.8. ref

显示使用索引的是哪个字段,可以是一个const常量;
ps:type里的ref指非唯一索引扫描,对索引字段,可能存在多个重复值;

在这里插入图片描述

从表t1和表t2中查询所有,查询条件:t1.col1=t2.col1、t1.col2=‘ac’;
同一个where列表中,优化器从右到左执行,索引有两个字段;
优先执行字段值’ac’,是const常量;
然后执行数据库shared中表t2中的字段col1,即shared.t2.col1;

4.9. rows
索引查询时,大致估算出查询到所需记录读取的行数,rows越小越好;

4.10. Extra

 额外信息,包含以下三种:
· (1)Using filesort
说明建立的、准备使用的索引index并没有被用到,执行了文件排序;
可能是sql语句写法有问题,与之前建立的索引index冲突了;

· (2)Using temporary
使用了临时表来保存中间结果,说明建立的索引没有使用完全;
常见于排序order by和分组查询group by;

· (3)Using index
select操作中用到了覆盖索引(Covering Index),说明sql执行的效率不错!
覆盖索引(Covering Index):
eg:先creat一个index,index_字段a_字段b;
然后select 字段a,字段b on table where 字段a=…,字段b=…
即先创建拥有某几个字段的索引,然后查询索引里的字段,where列表是索引字段的值;即当索引字段值为XXX时,查询该字段;这是select效率最高的方式。
··· 若同时出现using where,表明索引被用来执行索引键值的查找;
··· 若没有同时出现using where,表明索引没有用来执行索引键值的查找,只是用来读取数据;
 

猜你喜欢

转载自blog.csdn.net/u010445301/article/details/126220108
今日推荐