MySQL 创建索引的几大原则 和 使用索引优化查询

MySQL 创建索引的几大原则 和 使用索引优化查询

1、创建索引的几大原则

1.1、最左前缀匹配原则

mysql会一直向右匹配直到遇到范围查询 (>、<、between、like) 就停止匹配。
比如 a = 1 and b = 2 and c > 3 and d = 4 ,如果建立 (a,b,c,d) 顺序的索引,d是用不到索引的,如果建立 (a,b,d,c) 的索引则都可以用到,a,b,d的顺序可以任意调整。

1.2、=和in可以乱序

比如 a = 1 and b = 2 and c = 3 建立(a,b,c) 索引可以任意顺序,mysql的查询优化器会帮你优化成索引可以识别的形式。

1.3、选择 区分度高的列作为索引

区分度的公式是 count(distinct col)/count(*) ,表示字段不重复的比例,比例越大我们扫描的记录数越少,唯一键的区分度是1,而一些状态、性别字段可能在大数据面前区分度就是0,那可能有人会问,这个比例有什么经验值吗?使用场景不同,这个值也很难确定,一般需要join的字段我们都要求是0.1以上,即平均1条扫描10条记录。

1.4、索引列不能参与计算,保持列“干净”

比如 from_unixtime(create_time) = ’2014-05-29’ 就不能使用到索引,原因很简单,b+树中存的都是数据表中的字段值,但进行检索时,需要把所有元素都应用函数才能比较,显然成本太大。所以语句应该写成 create_time = unix_timestamp(’2014-05-29’);

1.5、尽量的扩展索引,不要新建索引

比如表中已经有a的索引,现在要加 (a,b) 的索引,那么只需要修改原来的索引即可。

2、使用索引的典型场景

2.1、匹配全值

对索引中所有列都指定具体值,即对索引中的所有列都有等值匹配的条件。

#设置组合索引(rental_date,inventory_id,customer_id)为唯一索引。
EXPLAIN 
SELECT  * 
FROM  rental 
WHERE rental_date = '2005-05-25 17:22:10' 
  AND inventory_id = 373 
  AND customer_id = 343 ;

2.2、匹配值的范围查询

对索引值进行范围查找。

#设置索引idx_fk_customer_id(customer_id)
EXPLAIN 
SELECT * 
FROM  rental 
WHERE customer_id >= 373 
  AND customer_id < 400 ;

2.3、匹配最左前缀

仅仅使用索引中的最左边列进行查询。比如组合索引(col1,col2,col3)能够被col1,col1+col2,col1+col2+col3的等值查询利用到的。

#创建索引idx_payment_date(payment_date,amount,last_update);
EXPLAIN 
SELECT 
  * 
FROM
  payment 
WHERE payment_date = '2006-02-14 15:16:03' 
  AND last_update = '2006-02-15 22:12:32' ;

从结果可以看出利用了索引,但又row为182行,所有只使用了部分索引。

EXPLAIN 
SELECT  * 
FROM payment 
WHERE amount = 3.98 
  AND last_update = '2006-02-15' ;

从结果看出,这次查询没有利用索引,进行了全表查找。

2.4、仅对索引查询进行查询

当查询列都在索引字段中。即select中的列都在索引中。

EXPLAIN 
SELECT  last_update 
FROM  payment 
WHERE payment_date = '2005-08-19 21:21:47' 
  AND amount = 4.99 ;

extra部分Using index,说明不需要通过索引回表,Using index就是平时说的覆盖索引扫描(即找到索引,就找到了要查询的结果,不用再回表查找了)。

2.5、匹配列前缀

仅仅使用索引的第一列,并且只包含索引第1列的开头部分进行查找。

#创建索引 idx_title_desc_part(title(10),description(20));
EXPLAIN 
SELECT title 
FROM  film_text 
WHERE title LIKE 'AFRICAN%' ;

2.6、索引部分等值匹配,部分范围匹配

EXPLAIN 
SELECT inventory_id 
FROM  rental 
WHERE rental_date = '2006-02-14 15:16:03' 
  AND customer_id >= 300 
  AND customer_id <= 400 ;

type=ref,说明使用了索引。

2.7、列名是索引,is null,使用索引

EXPLAIN 
SELECT  * 
FROM  payment 
WHERE rental_id IS NULL ;

3、索引存在,但不能使用索引的典型场景

3.1、以%开头的like查询

EXPLAIN 
SELECT  * 
FROM  actor 
WHERE last_name LIKE '%NI%' ;

#优化
EXPLAIN 
SELECT  * 
FROM
  ( SELECT actor_id 
  FROM   actor 
  WHERE last_name LIKE '%NI%') a,
  actor b 
WHERE a.actor_id = b.actor_id ;

3.2、数据类型出现隐式转化

数据类型出现隐式转化,不会使用索引

EXPLAIN 
SELECT * 
FROM  actor 
WHERE last_name = 1 ;

#使用索引
EXPLAIN 
SELECT  * 
FROM  actor 
WHERE last_name = '1' ;

3.3、组合索引,不满足最左原则

组合索引,不满足最左原则,不使用符合索引

EXPLAIN 
SELECT  * 
FROM payment 
WHERE amount = 3.98 
  AND last_update = '2006-02-15 22:12:32' ;

3.4、估计使用索引比全表扫描还慢

估计使用索引比全表扫描还慢,则不要使用索引

如查询以“S”开头的标题的电影,返回记录比例比较大,mysql预估索引扫描还不如全表扫描。

EXPLAIN 
SELECT  * 
FROM  film_text 
WHERE title LIKE 'S%' ;

3.5、用or分割条件

用or分割条件,若or前后只要有一个列没有索引,就都不会用索引

EXPLAIN 
SELECT  * 
FROM  payment 
WHERE customer_id = 203 
  OR amount = 3.96 ;

猜你喜欢

转载自blog.csdn.net/xiaojin21cen/article/details/84143524