Mysql性能调优(五)

前言

上篇文章我们介绍了MySQL体系结构以及存储引擎的相关介绍。接下来，我们给大家介绍SQL语句的优化以及具体的sql优化步骤。接下来我们介绍优化sql的具体步骤。
其实，无论在开发中还是在人工智能方面，都脱离不了数据库，用来存储我们需要的数据。由于初期的时候，数据量还小，因此，我们在初期写SQL语句的时候更重视功能上的实现，但是，随着项目的真正投入使用的时候，数据量呈指数型递增，很多sql语句开始逐渐显出性能问题，对项目的性能要求也越来越高，此时，我们就应该对SQL语句进行必要的优化，接下来，我们就为大家介绍在Mysql中SQL的具体优化步骤。当我们对一个有SQL性能问题进行优化的时候，我们一定要从sql语句本身分析，尽可能的做到SQL语句优化的最大化。

一、查看SQL执行频率

当我们将MySQL客户端连接成功之后，通过以下命令可以提供服务器状态信息。

show[session|global] status

不过我们从上面的命令可以发现有一个参数session或者global来显示session级(当前连接)的计算结果和global级(自数据库上次启动至今)的统计结果。如果不特别申明的时候，默认使用的是session。下面的命令显示了当前的session中所有统计参数的值：

show status like `Com______`;

具体的结果如下：

我们可以通过以下的命令查看sql语句的状态

show status like `Innodb_rows_%`;

具体的结果如下：

这里我们介绍几个参数，其中的Com_xxx表示的是每个xxx语句执行的次数，我们通常比较关心的是以下几个统计参数：

这里需要我们特别说明的是以下两个参数：

Com_***：这些参数对于所有存储引擎的表操作都会进行累计；

Innodb_***：这几个参数只是针对InnoDB存储引擎的，累加的算法也略有不同。

二、定位低效率执行SQL

可以通过以下两种方式定位执行效率降低的SQL语句。

慢查询日志：通过慢查询日志定位那执行效率降低的SQL语句，用–log-slow-queries[=file_name]选项启动时，mysqld写了一个包含所有执行时间超过long_query_time秒的SQL语句的日志文件。

show processlist:慢查询日志在查询结束以后才记录，所以在应用反映执行效率出现问题的时候查询慢查询日志并不能定位问题，可以使用show processlist命令查看当前MySQL在进行的线程，包括线程的状态、是否锁表等，可以实时地查看SQL的执行情况，同时对一些锁表操作进行优化。

show processlist;

具体的结果如下：

接下来，我们介绍以上表中各个列名的含义：

id列：用户在登录mysql时，系统分配的"connection_id"，可以使用函数connection_id()查看

user列：显示当前用户。如果不是root，这个命令就值显示用户权限范围的sql语句。

host列：显示这个语句是从哪个ip的哪个端口上发的，可以用来跟踪出现问题语句的用户

db列：显示这个进程目前连接的是哪个数据库

command列：显示当前连接的执行命令，一般取值为休眠(sleep)，查询(query)、连接(connect)等

time列：显示这个状态持续的时间，单位是秒

state列：显示使用当前连接的sql语句的状态，很重要的列。state描述的是语句执行中的某一状态，一个sql语句，以查询为例，可能需要经过copying to tmp table、sorting result、sending data等状态可以完成

info列：显示这个sql语句，是判断问题语句的一个重要依据。

三、explain分析执行计划

通过以上步骤查询到效率低的SQL语句，可以通过EXPLAIN或者DESC命令获取MySQL如何执行select语句的信息，包括在select语句执行过程中表如何连接以及连接的顺序。接下来，我们用以下的语句来查看执行计划：

explain select * from tb_item where id = 1;

具体结果如下：

我们通过一个实例语句来实现

explain select * from tb_item where title = '阿尔卡特(OT-979) 冰川白 联通3G手机3';

具体结果如下：

在explain中我们介绍相关的字段以及具体的含义

接下来，我们以一个案例来详细演示sql语句的具体的优化；首先让我们准备三张表，分别是：t_user、user_role、t_role表，他们之间的关系如图所示：

接下来我们创建三张表，首先创建t_role表，具体命令如下：

create table `t_role`(
	`id` varchar(32) NOT NULL,
	`role_name` varchar(255) DEFAULT NULL,
	`role_code` varchar(255) DEFAULT NULL,
	`description` varchar(255) DEFAULT NULL,
	PRIMARY KEY(`id`),
	UNIQUE KEY `unique_role_name`(`role_name`)
)ENGINE = InnoDB DEFAULT CHARSET=utf8;

接下来我们建立两张表，分别是t_user表和user_role表，由于t_role表已经建过表了，因此，为了篇幅，我们通过图的方式来实现：

接下来，我们为建好的表来插入数据，具体插入语句如下：

1、explain之id

id字段是select查询的序列号，是一组数字，表示的是查询中执行select子句或者是操作表的顺序。id情况有三种：

1、id相同表示加载表的顺序是从上到下：

explain select * from t_role r, t_user u, user_role ur where r.id = ur.role_id and u.id = ur.user_id;

2、id不同id值越大，优先级越高，越先被执行。

explain select * from t_role where id = (select role_id from user_role where user_id = (select id from t_user where username = 'stu1'));

3、id有相同，也有不同，同时存在。id相同的可以认为一组，从上往下顺序执行；在所有的组中，id的值越大，优先级越大，越先执行。

explain select * from t_role r, (select * from user_role ur where ur.`user_id` = '2') a where r.id = a.role_id;

2、explain之select_type

表示select的类型，常见的取值，如下表所示：

3、explain之table

展示这一行的数据是关于哪一张表的

4、explain之type

type显示的是访问类型，是较为重要的一个指标，可取值如图所示：

这种表从好到坏的结果如图所示：

NULL > system > const > eq_ref > ref > fulltext > ref_or_null > index_merge > unique_subquery > index_subquery > range > index > ALL

5、explain之key

possible_keys:显示可能应用在这张表的索引，一个或多个；

key：实际使用的索引，如果为NULL，则没有使用索引；

key_len：表示索引中使用的字节数，该值为索引字段最大可能长度，并非实际使用长度，在不损失精确性的前提下，长度越短越好。

6、explain之rows

扫描行的数量。

7、explain之extra

其他的额外的执行计划信息，在该列展示。

四、show profile分析SQL

MySQL其实从5.0.37版本开始增加了对show profiles和 show profile语句的支持。show profiles能够在做SQL优化时帮助我们了解时间都耗费哪里去了。我们可以通过have_profiling参数，能够看到当前的MySQL是否支持profile；

select @@have_profiling;

mysql默认profiling是关闭的，可以通过set语句在session级别开启profiling；

select @@have_profiling;

接下来我们通过profiling开启开关

set profiling = 1;

接下来，我们通过了profile，我们能够更清楚地了解SQL执行的过程。首先，我们可执行一系列的操作，具体如下所示：

show databases;
use db01;
show tables;
select * from tb_item where id < 5;
select count(*) from tb_item;

执行完上述的命令之后，在执行show profiles指令，来查询SQL语句执行的耗时；具体过程如下：

接下来，我们通过以下命令来查看到该SQL执行过程中每个线程的状态和消耗时间：

show profile for query query_id;

这里需要我们注意的是：sending data状态表示MySQL线程开始访问数据行并把结果返回给客户端，而不仅仅是返回客户端。由于在sending data状态下，MySQL线程往往需要做大量的磁盘读取操作,所以经常是整个查询中耗时最长的状态。

在获取到最消耗时间的线程状态后，MySQL支持进一步选择all、cpu、block io、context switch、page faults等明细类型查看，MySQL在使用什么资源上耗费了过高的时间。例如，选择查看CPU的耗费时间；

五、trace分析优化器执行计划

MySQL5.6提供了对SQL的跟踪trace，通过trace文件能够进一步了解为什么优化器选择A计划，而不是选择B计划。我们打开trace，设置格式为json，并设置trace最大能够使用的内存大小，避免解析过程中因为默认内存过小而不能够完整展示。

set optimizer_trace = "enabled=on", end_markers_in_json = on;
set optimizer_trace_max_men_size = 1000000;

执行SQL语句

select * from tb_item where id<4;

最后检查information_schema.optimizer_trace就可以知道MySQL是如何执行SQL的：

select * from information_schema.optimizer_trace\G;

具体的内容如下：

总结

上一篇文章我们mysql的体系结构以及存储引擎，从而让我们进一步了解mysql的内部结构以及工作原理，另外还给大家介绍mysql中几种典型存储引擎的区别以及具体的使用。本文我给大家介绍了SQL的优化，包括查看SQL执行频率，定位低效率的SQL以及explain分析的执行计划。因此，mysql是很重要的一个技能，几乎计算机中的每个岗位都需要一个mysq技能，因此，需要我们特别的掌握。生命不息，奋斗不止，我们每天努力，好好学习，不断提高自己的能力，相信自己一定会学有所获。加油！！！

前言