mysql索引正确解读，牛逼

探究一个问题：mysql的innodb引擎下面，索引是个什么数据结构？

在这里插入图片描述

答：严谨点来说索引数据结构应该是b+树，mysql的索引是在b树的基础上面演变过来的。官网中有原话的哦

b+树特点（针对普通索引建立的b+树来说）
1. 节点是排好序的
2. 一个节点可以存多个元素
3. 非叶子节点的主键都冗余了一份在叶子节点上面
4. 叶子节点间的连接是双向指针

故b+树大概长成这样
在这里插入图片描述

结合b+树图解我们可以来试着解读最左前缀法则、回表、索引下推了

最左前缀法则：我们可以理解为&操作，a&b&c当a为false时，后面的b、c不管是true、false直接失效，整个a&b&c生效。同理索引abc也是如此，查询操作第一个条件都不是a，整个索引直接失效

最左前缀法则干嘛的？

什么是回表？（除了主键索引外的索引都是辅助索引）

回表的情况有哪些？

什么是索引下推？

为什么使用索引下推？

好处：减少了回表的次数，由于在辅助索引树中就进行了过滤，因此回表的数据一定是符合我们需要的数据。如果不开启辅助索引，那么我们需要将所有走索引符合条件的主键值进行回表，然后进行过滤操作，回表涉及到对磁盘的io操作，这样开销太大了

现在是不是感觉豁然开朗了呢？别急接着细究。

b+树的叶子节点也可以称之为页，页大小多少？

这个页是干嘛的？页有什么用？

首先普及一个概念：
1. 我们每次读取数据都是从磁盘中获取的，然后会把读取到的数据放入内存当中，这个内存有点复杂，其实是有一个专门的缓存池来存放这些数据的，这个缓存池为bufferpool，然后后续需要读取这条数据的线程来时，从内存中获取即可，无需再次从磁盘中获取了
2. io：数据流的读入读出
页的作用：减少io次数
- 我们io一次把一页放入缓存、我们io多次把等量数据放入缓存，这俩效果相同，但是前者只需io一次，后者io多次。

那为什么mysql是设置页为16kb？

答：为了减少页碎片化问题的出现
操作系统页大小为4kb，为了让操作系统取出来的页对应我们mysql中的页，我们可以把mysql页大小设置为操作系统页的整数倍，这样就不会出现操作系统中的页，转换成mysql中的页时会出现碎片化的问题出现了。

索引是什么？

你这么了解索引，那么为什么不用uuid作为表的主键呢？

索引的结构能具体说清楚点吗？（分主键索引、辅助索引来说）

辅助索引叶子节点为什么不存放完整的数据，只是放主键？

这么了解索引那你知道有哪些索引吗？

这么了解索引来实战试试手呗(加深理解 h为单索引 abc为组合索引 user表数据量超级大)

查询优化器：辅助索引+回表的代价 > 全表扫描此时会走全表扫描
select * from user where h > 30; （根据查询优化器来判断）
1. 走索引先从辅助索引b+树查找h>30对应的主键，回表查出所有数据
2. 也可能不走索引直接全表扫描
select * from user order by h （根据查询优化器来判断）
1. 走索引 h对应的b+树已经对h排好序了
2. 不走索引查询优化器会与全表扫描的代价与之比较，直接从主键b+树把数据加载到内存，基于内存排序
select h from user; 走索引辅助索引表叶子节点已经有h字段的值
select * from user where h= 10 and h like “%0” 索引下推：从辅助索引表中获取主键，过滤筛选主键，回表

关注我一起慢慢变强，来自大三狗的一点学习心得over