一、为什么要进行数据库优化

1、避免网站页面出现访问错误
由于数据库连接timeout产生页面5xx错误
由于慢查询造成页面无法加载
2、增加数据库的稳定性
很多数据库稳定问题都是由于低效的查询引起的
3、优化用户体验
流畅的网站访问速度，良好的用户体验

二、mysql数据库优化的几个方面

如图：
在这里插入图片描述
A、SQL及索引优化
根据需求写出良好的SQL，并创建有效的索引，实现某一种需求可以多种写法，这时候我们就要选择一种效率最高的写法。这个时候就要了解sql优化
B、数据库表结构优化
根据数据库的范式，设计表结构，表结构设计的好直接关系到写SQL语句。
C、系统配置优化
大多数运行在Linux机器上，如tcp连接数的限制、打开文件数的限制、安全性的限制，因此我们要对这些配置进行相应的优化。
D、硬件配置优化
选择适合数据库服务的cpu，更快的IO，更高的内存；cpu并不是越多越好，某些数据库版本有最大的限制，ＩＯ操作并不是减少阻塞。
注：通过上图可以看出，该金字塔中，优化的成本从下而上逐渐增高，而优化的效果会逐渐降低。

三、发现有问题的SQL

先准备一些数据。

打开mysql官方文档。

在这里插入图片描述

下过来解压。将里面的sql执行就行。

然后登录mysql mysql -u root -p。通过show variables like '%slow_query_log%';查看一下慢日志查询有没有开启。

mysql> show variables like '%slow_query_log%';
+---------------------+----------------------------------------------------+
| Variable_name       | Value                                              |
+---------------------+----------------------------------------------------+
| slow_query_log      | OFF                                                |
| slow_query_log_file | /usr/local/mysql/data/weiweideMacBook-Pro-slow.log |
+---------------------+----------------------------------------------------+
2 rows in set (0.00 sec)

可以看到slow_query_log是 OFF状态。通过set global slow_query_log=1;开启慢日志查询。

mysql> set global slow_query_log=1;
Query OK, 0 rows affected (0.02 sec)

再查询一下。

mysql> show variables like '%slow_query_log%';
+---------------------+----------------------------------------------------+
| Variable_name       | Value                                              |
+---------------------+----------------------------------------------------+
| slow_query_log      | ON                                                 |
| slow_query_log_file | /usr/local/mysql/data/weiweideMacBook-Pro-slow.log |
+---------------------+----------------------------------------------------+
2 rows in set (0.00 sec)

日志文件就在slow_query_log_file配置的目录。

通过set global long_query_time =1;设置超过1s的查询时间会被记录到慢日志中。默认是0。(可以根据自己电脑或者服务器的配置设置，因为sql查询速度和服务器配置也是有关系的)

mysql> set global long_query_time =1;
Query OK, 0 rows affected (0.00 sec)

开启慢日志查询的日志。set global log_queries_not_using_indexes=on;

因为我电脑配置的原因，我把查询时间限制设置为0了。然后新开个命令窗口监听一下日志文件。sudo tail -50f /usr/local/mysql/data/weiweideMacBook-Pro-slow.log。然后执行一条sql语句，会发现在日志文件中已经有了。

Tcp port: 3306  Unix socket: /tmp/mysql.sock
Time                 Id Command    Argument
# Time: 2020-01-07T05:52:42.846652Z
# User@Host: root[root] @ localhost []  Id:   151
# Query_time: 0.000146  Lock_time: 0.000066 Rows_sent: 2  Rows_examined: 2
use sakila;
SET timestamp=1578376362;
select * from store;

说明：
# Time: 查询的执行时间
# User@Host: root[root] @ localhost [] Id: 执行sql的主机信息
# Query_time: SQL的执行信息：
Query_time：SQL的查询时间
Lock_time：锁定时间
Rows_sent：所发送的行数
Rows_examined：锁扫描的行数
SET timestamp=1527268014; -----SQL执行时间
select * from staff; -------SQL的执行内容

慢日志生成之后，可以使用mysql自带的工具分析。比如命令行输入（不是mysql命令界面）

sudo mysqldumpslow -t 10 /usr/local/mysql/data/weiweideMacBook-Pro-slow.log

Count: 1  Time=0.00s (0s)  Lock=0.00s (0s)  Rows=2.0 (2), root[root]@localhost
  SELECT * from staff

Count: 1  Time=0.00s (0s)  Lock=0.00s (0s)  Rows=2.0 (2), root[root]@localhost
  select * from store

可以看到一些基本的分析。还可以使用MySQL慢查日志分析工具(pt-query-digest)进行分析。

四、哪些是有问题的sql

1、查询次数多且每次查询占用时间长的sql

	通常为pt-query-digest分析的前几个查询；该工具可以很清楚的看出每个SQL执行的次数及百分比等信息，执行的次数多，占
	比比较大的SQL

2、IO大的sql

	注意pt-query-digest分析中的Rows examine项。扫描的行数越多，IO越大。

3、未命中的索引的SQL

	注意pt-query-digest分析中的Rows examine 和Rows Send的对比。说明该SQL的索引命中率不高，对于这种SQL，我们
	要重点进行关注。

五、通过explain查询分析SQL的执行计划

1、使用explain查询SQL的执行计划

SQL的执行计划侧面反映出了SQL的执行效率，具体执行方式如下所示：在执行的SQL前面加上explain关键词即可

在这里插入图片描述
2、各个字段的解释

id列数字越大越先执行，如果说数字一样大，那么就从上往下依次执行，id列为null的就表是这是一个结果集，不需要使用它来
进行查询。

select_type

simple：表示不需要union操作或者不包含子查询的简单select查询。有连接查询时，外层的查询为simple，且只有一个

primary：一个需要union操作或者含有子查询的select，位于最外层的单位查询的select_type即为primary。且只有一个

union：连接的两个select查询，第一个查询是dervied派生表，除了第一个表外，第二个以后的表select_type都是union

dependent union：与union一样，出现在union 或union all语句中，但是这个查询要受到外部查询的影响

union result：包含union的结果集，在union和union all语句中,因为它不需要参与查询，所以id字段为null

subquery：除了from子句中包含的子查询外，其他地方出现的子查询都可能是subquery

dependent subquery：与dependent union类似，表示这个subquery的查询要受到外部表查询的影响

derived：from字句中出现的子查询，也叫做派生表，其他数据库中可能叫做内联视图或嵌套select

table

显示的查询表名，如果查询使用了别名，那么这里显示的是别名，如果不涉及对数据表的操作，那么这显示为null，如果显示为尖括
号括起来的<derived N>就表示这个是临时表，后边的N就是执行计划中的id，表示结果来自于这个查询产生。如果是尖括号括起来
的<union M,N>，与<derived N>类似，也是一个临时表，表示这个结果来自于union查询的id为M,N的结果集。

type

依次从好到差：system，const，eq_ref，ref，fulltext，ref_or_null，unique_subquery，index_subquery，range
,index_merge，index，ALL，除了all之外，其他的type都可以使用到索引，除了index_merge之外，其他的type只可以用到
一个索引。

system：表中只有一行数据或者是空表，且只能用于myisam和memory表。如果是Innodb引擎表，type列在这个情况通常都是all
或者index

const：使用唯一索引或者主键，返回记录一定是1行记录的等值where条件时，通常type是const。其他数据库也叫做唯一索引扫描

eq_ref：出现在要连接过个表的查询计划中，驱动表只返回一行数据，且这行数据是第二个表的主键或者唯一索引，且必须为not 
null，唯一索引和主键是多列时，只有所有的列都用作比较时才会出现eq_ref

ref：不像eq_ref那样要求连接顺序，也没有主键和唯一索引的要求，只要使用相等条件检索时就可能出现，常见与辅助索引的等值
查找。或者多列主键、唯一索引中，使用第一个列之外的列作为等值查找也会出现，总之，返回数据不唯一的等值查找就可能出现。

fulltext：全文索引检索，要注意，全文索引的优先级很高，若全文索引和普通索引同时存在时，mysql不管代价，优先选择使用全
文索引

ref_or_null：与ref方法类似，只是增加了null值的比较。实际用的不多。

unique_subquery：用于where中的in形式子查询，子查询返回不重复值唯一值

H：index_subquery：用于in形式子查询使用到了辅助索引或者in常数列表，子查询可能返回重复值，可以使用索引将子查询去重

range：索引范围扫描，常见于使用>,<,is null,between ,in ,like等运算符的查询中。

index_merge：表示查询使用了两个以上的索引，最后取交集或者并集，常见and ，or的条件使用了不同的索引，官方排序这个在
ref_or_null之后，但是实际上由于要读取所个索引，性能可能大部分时间都不如range

index：索引全表扫描，把索引从头到尾扫一遍，常见于使用索引列就可以处理不需要读取数据文件的查询、可以使用索引排序或者分
组的查询。

all：这个就是全表扫描数据文件，然后再在server层进行过滤返回符合要求的记录。

possible_keys

查询可能使用到的索引都会在这里列出来

key

查询真正使用到的索引，select_type为index_merge时，这里可能出现两个以上的索引，其他的select_type这里只会出现一个

key_len

用于处理查询的索引长度，如果是单列索引，那就整个索引长度算进去，如果是多列索引，那么查询不一定都能使用到所有的列，
具体使用到了多少个列的索引，这里就会计算进去，没有使用到的列，这里不会计算进去。留意下这个列的值，算一下你的多列
索引总长度就知道有没有使用到所有的列了。要注意，mysql的ICP特性使用到的索引不会计入其中。另外，key_len只计算where
条件用到的索引长度，而排序和分组就算用到了索引，也不会计算到key_len中。

ref

如果是使用的常数等值查询，这里会显示const，如果是连接查询，被驱动表的执行计划这里会显示驱动表的关联字段，如果是条件
使用了表达式或者函数，或者条件列发生了内部隐式转换，这里可能显示为func

rows

这里是执行计划中估算的扫描行数，不是精确值。

extra

这个列可以显示的信息非常多，有几十种，常用的有

distinct：在select部分使用了distinc关键字

no tables used：不带from字句的查询或者From dual查询

使用not in()形式子查询或not exists运算符的连接查询，这种叫做反连接。即，一般连接查询是先查询内表，再查询外表，
反连接就是先查询外表，再查询内表。

using filesort：排序时无法使用到索引时，就会出现这个。常见于order by和group by语句中

using index：查询时不需要回表查询，直接通过索引就可以获取查询的数据。

using join buffer（block nested loop），using join buffer（batched key accss）：5.6.x之后的版本优化关联
	查询的BNL，BKA特性。主要是减少内表的循环数量以及比较顺序地扫描查询。

using sort_union，using_union，using intersect，using sort_intersection：
using intersect：表示使用and的各个索引的条件时，该信息表示是从处理结果获取交集
using union：表示使用or连接各个使用索引的条件时，该信息表示从处理结果获取并集
using sort_union和using sort_intersection：与前面两个对应的类似，只是他们是出现在用and和or查询信息量大时，
	先查询主键，然后进行排序合并后，才能读取记录并返回。

using temporary：表示使用了临时表存储中间结果。临时表可以是内存临时表和磁盘临时表，执行计划中看不出来，
	需要查看status变量，used_tmp_table，used_tmp_disk_table才能看出来。

using where：表示存储引擎返回的记录并不是所有的都满足查询条件，需要在server层进行过滤。查询条件中分为限制条件
	和检查条件，5.6之前，存储引擎只能根据限制条件扫描数据并返回，然后server层根据检查条件进行过滤再返回真正符合
	查询的数据。5.6.x之后支持ICP特性，可以把检查条件也下推到存储引擎层，不符合检查条件和限制条件的数据，直接不读取，
	这样就大大减少了存储引擎扫描的记录数量。extra列显示using index condition

firstmatch(tb_name)：5.6.x开始引入的优化子查询的新特性之一，常见于where字句含有in()类型的子查询。
	如果内表的数据量比较大，就可能出现这个

loosescan(m..n)：5.6.x之后引入的优化子查询的新特性之一，在in()类型的子查询中，子查询返回的可能有重复记录时，
	就可能出现这个
 
除了这些之外，还有很多查询数据字典库，执行计划过程中就发现不可能存在结果的一些提示信息

filtered

使用explain extended时会出现这个列，5.7之后的版本默认就有这个字段，不需要使用explain extended了。这个字段表示
存储引擎返回的数据在server层过滤后，剩下多少满足查询的记录数量的比例，注意是百分比，不是具体记录数。

忘不掉就记着吧

发布了41 篇原创文章 · 获赞 9 · 访问量 2518

私信关注

mysql性能优化系列(一) ---发现有问题的sql(慢日志和explain分析)

一、为什么要进行数据库优化

二、mysql数据库优化的几个方面

三、发现有问题的SQL

四、哪些是有问题的sql

五、通过explain查询分析SQL的执行计划

猜你喜欢