干货！SQL性能优化，书写高质量SQL语句（二）

本片博文承接上一篇《干货！SQL性能优化，书写高质量SQL语句》。这里非常感谢大家，很给面子，评论区给了很多意见和指导！上篇文章出现太多的理论知识，并没有用具体的测试用例说服大家，那么本片干货分享主要针对上篇掘友们提出的疑问点进行回答，提供详细的测试用例。如有不足还请赐教~

数据库版本 mysql 5.7.26

1. where语句使用 IN 到底走不走索引？

首先先创建一张测试表

CREATE TABLE `student` (
  `id` bigint(20) NOT NULL AUTO_INCREMENT COMMENT '主键',
  `name` varchar(255) NOT NULL,
  `class` varchar(255) DEFAULT NULL,
  `page` bigint(20) DEFAULT NULL,
  `status` tinyint(3) unsigned NOT NULL COMMENT '状态：0 正常，1 冻结，2 删除',
  PRIMARY KEY (`id`)
) ENGINE=InnoDB AUTO_INCREMENT=0 DEFAULT CHARSET=utf8mb4
复制代码

批量新增100w条数据

DELIMITER ;;
    CREATE PROCEDURE insertData()
    BEGIN
        declare i int;
        set i = 1 ;
        WHILE (i < 1000000) DO
            INSERT INTO student(`name`,class,`page`,`status`)
                VALUES(CONCAT('class_', i),
                    CONCAT('class_', i),
                i, (SELECT FLOOR(RAND() * 2)));
            set i = i + 1;
        END WHILE;
        commit;
		END;;
CALL insertData();
复制代码

name字段不加索引的前提下，执行以下SQL

SELECT * FROM student WHERE `name` IN
('class_1','class_100','class_1000','class_100000');
复制代码

耗时 0.8s

name字段加索引后,耗时 0.021s，查询语句走索引!

但是！如果数据量大，例如估计为全表80%，才会走全表扫描

再查一下 student 表中的 status 字段 in 的情况

SELECT * FROM student WHERE `status` IN(0,2);
复制代码

加索引后,因为数据量大,并未走索引，如图所示：

总结

翻阅大量资料进行测试，如果是mysql5.5之前的版本，确实是不会走索引的，在5.5及之后的版本中，MySql做了优化，在2010年发布的5.5版本中,优化器对 IN 操作符可以自动完成优化，针对建立了索引的列可以使用索引，没有索引的列还是会走全表扫描，但是如果数据量大，例如估计为全表80%，会走全表扫描！

比如，5.5 之前的版本（以下都是 5.5 以前的版本）

select * from a where id in (select id from b)
复制代码

这条 sql 语句它的执行计划其实并不是先查询出 b 表的所有 id，然后再与 a 表的 id 进行比较。mysql 会把 in 子查询转换成 exists 相关子查询，所以它实际等同于这条 sql 语句

 select * from a where exists(select * from b where b.id=a.id)
复制代码

2.where子句中使用 IS NULL 或 IS NOT NULL 到底走不走索引

我们分三种情况来测试

索引列 name 默认值为 NULL 允许为空
索引列 name 默认值为 '1' 允许为空
索引列 name 默认值为 '1' 不允许为空

1.索引列 name 默认值为 NULL 允许为空

explain SELECT * FROM student WHERE `name` is not null
复制代码

explain SELECT * FROM student WHERE `name` is null
复制代码

分析: IS NULL 使用了索引 , IS NOT NULL 没有走索引

2.索引列 name 默认值为 '1' 允许为空

分析: IS NULL 使用了索引 , IS NOT NULL 没有走索引

3.索引列 name 默认值为 '1' 不允许为空

结论

is not null不管什么情况下都不会走索引,is null在字段允许为空时会使用索引