【MYSQL高级】索引

1.什么是索引？

索引是帮助获取数据的数据结构，排好序的快速查找就是索引。

2.建立索引的数据结构

在数据之外，数据库系统还维护着满足特定查找算法的数据结构，这些数据结构以某种方式引用（指向）数据。这样就可以在这些数据结构上实现查找算法，这种数据结构，就是索引。

3.索引的存储位置

一般来说索引很大，不可能全部村存储在内存中，因此索引以索引文件的形式存储在磁盘上。

4.建立索引的优势和劣势

优势：①提高数据库的检索效率，降低数据库的IO成本。②通过索引对数据库进行排序，降低数据排序的成本，降低了CPU的消耗。
劣势：①索引也是一张表，该表保存了主键和索引字段，并指向实体表的记录，所以索引列也是要占用空间的。②索引大大提高了查询速度，同时降低了表的更新速度。（因为更新表，MYSQL不仅要保存数据，还要更新索引字段）③索引只是提高效率的一个因素，如果MYSQL有大数据量的表就需要建立最有效的索引。

5.索引的分类以及创建语句

-单值索引：既一个索引只包含单个列，一个表可以有多个单列索引
-唯一索引：索引列的值必须唯一，但允许有空值。
-复合索引：一个索引包含多个列。
-基本语法：
-创建：
-create [unique] INDEX indexname ON mytable(columnname(length));
-ALTER mytable ADD [UNIQUE] INDEX [indexname] ON (columnname(length));
-删除：drop INDEX [indexname] ON mytable;
-查看：show INDEX FROM table_name;

-使用ALTER命令，四种方式添加数据表的索引：

ALTER TABLE tbl_name ADD PRIMARY KEY (column_list);该句添加一个主键，这意味着索引值必须是唯一的，且不能为null
ALTER TABLE tbl_name ADD UNIQUE index_name (column_list);该句创建索引的值必须是唯一的（除了NULL，NULL可能出现多次）
ALTER TABLE tbl_name ADD INDEX index_name (column_list);添加普通索引，索引值可出现多次
ALTER TABLE tbl_name ADD FULLTEXT index_name (column_list);指定索引为FULLTEXT，用于全文索引

6.索引的结构

BTree 索引：主修
hash索引
full-text全文索引
R-tree索引

7.哪些情况下应该建立索引

       1.主键自动建立唯一索引
       2.频繁作为查询条件的字段应该创建索引。
       3.查询中与其他表关联的字段，外键关系建立索引
       4.频繁更新的字段不适合建立索引
       5.where条件里用不到的字段不创建索引
       6.单件/组合索引的选择问题：（在高并发下创建组合索引）
       7.查询中排序的字段，排序字段若通过索引访问将提高访问速度。
       8.查询中统计或者分组字段（group by）

8.哪些情况下不应该建索引

       1.表记录太少
       2.经常增删改的表
       3.数据重复的列

简单使用索引

   1.1 单值索引
   create index idx_user_name on user(name);
   1.2 复合索引
   create idx_user_nameEmail on user(name,email);

9.性能分析

       1.mysql查询优化（mysql的内部架构）
       2.mysql常见瓶颈
           2.1 CPU达到饱和
           2.2 IO负载过大
           2.3 服务器硬件性能瓶颈
       3. Explain：使用Explain关键字可以模拟优化器执行MYSQL查询语句，从而知道MYSQL如何处理你的SQL语句的。分析你的查询语句或者是表结构的性能瓶颈。
           3.1：能干嘛？
               1.表的读取顺序
               2.数据读取操作的操作类型
               3.哪些索引可以使用
               4.哪些索引被实际使用
               5.表之间的引用
               6.每张表有多少行被优化器查询

           3.2 使用
               Explain+SQL语句

           3.3   查询包含信息
           id   select_type   table   type   possible_keys   key       key_len       ref       rows   extra
           3.4 字段解释
               id：select查询的序列号，包含一组数字，表示查询中执行的select子句或操作表的顺序
                   1. 三种情况：
                       1.1 id相同，执行顺序从上到下

1.2 id不同，如果是子查询，id的序号递增，id值越大优先级越高，越先被执行。

1.3 id相同不同，同时存在。

select——type：查询方式

                   -simple：简单的select查询，查询中不包括子查询或者union
                   -primary：查询中若包含任何复杂的子部分，这是最外层查询的标记。
                   -subquery：在select或where列表中添加了子查询
                   -derived：在from列表中包含的子查询被标记为derived（衍生），MySQL会递归执行这些子查询，把结果放在临时表中
                   -union 若第二个select出现在union之后，则被标记为union；
                           若union包含在from子句中，外层select被标记为derived
                   -union result:从union表获取select。
               table：显示这一行数据关于哪张表。

               type：访问类型
                   -从最好到最差依次是：
                   system>const>eq_ref>ref>range>index>ALL(一般来说，得保证查询至少达到range级别，最好达到ref)
                   system:表只有一行记录（等于系统表），这是const类型的特例，平时不会出现。
                   const：表示通过索引一次就找到了，const用于比较primary key或者unique索引。因为只匹配一行数据，所以很快。比如将主键置于where列表中，MYSQL就能将该查询转化为一个常量。

eq_ref:唯一性索引扫描，对于每个索引键，表中只有一条记录与之匹配。常见于主键或唯一索引扫描

ref:非唯一性索引扫描，返回匹配某个单独值的行，然而他可能找到多个符合条件的行，所以它属于查找和扫描的混合体。

range：只检索给定范围的行，使用一个索引来选择行。key列显示使用了哪个索引，一般就是在你的where语句中出现了between，<,>,in等的查询。这种扫描比全表查询好。

index：全索引扫描，只遍历索引树，这通常比ALL快。

all：属于全表查询

               possible_keys(理论索引)和key（实际索引）
                   possible_keys：显示可能应用在这张表中的索引，一个或者多个查询涉及的字段上若存在索引，则该索引将被列出，但不一定在实际查询中应用。
                   key：实际使用的索引，如果为NUL   L，则没有使用索引。②查询中若使用了覆盖索引（查询的字段和我的复合索引字段顺序数量完全一致），则该索引仅出现在key列表中。

key_len：表示索引中使用的字节数，可通过该列计算查询中使用的索引的长度，在不损失精确性的情况下，长度越短越好。key_len显示的值是索引字段的最大可能长度，并非实际长度，既key_len根据表的计算得来的，不是通过表内检索出来的。（同样的查询结果精度越小越好）。
ref：显示索引的哪一列被使用了，如果可能的话，是一个常数。哪些列或常量被用于查找索引列上的值。

row：找到所需的记录数读取的行数。

Extra：包含不适合在其他列显示但是十分重要的信息。
1.using filesort：说明mysql会对数据使用一个外部的索引排序，而不是按照表内的索引顺序进行读取。MySQL无法利用索引完成的排序操作称为”文件排序“。（出现了filesort是一种不好的现象）

2.using temporary：使用了临时表保存中间结果，mysql在对查询结果排序时使用临时表。常见于排序order by和分组查询group by

3.using index：表示相应的select操作使用了覆盖索引，避免了表的数据行，效率不错。如果同时出现using where，表明索引被用来执行索引键值的查找。如果没有同时出现using where，表明索引用来读取数据而非执行查找动作。

、

解释索引覆盖：就是select查询的字段就是索引的字段，不必读取数据行。
4.using where 表明使用了where

                   5.using join buffer 使用了连接缓存
                   6.impossible where：where子句的值总是false，不能用来获取任何元组。
                   7.select tables optimized away 在没有使用groupby子句下使用min/max操作，使用myisam下的count(*).
                   8.distinct：优化distinct操作，在找到第一匹配的元组之后即停止找同样值的操作。

小白又开始整活了

发布了139 篇原创文章 · 获赞 93 · 访问量 5万+

私信关注