¿El índice de clave principal es un índice agrupado? Tipos de índice MySQL

@[toc] Cuando Song Ge introdujo los índices de MySQL en artículos anteriores, algunos amigos expresaron que estaban confundidos por el concepto de índice de clave principal, índice de clave no principal, índice agrupado, índice no agrupado, índice secundario, índice auxiliar Espere un minuto, echemos un vistazo a estos conceptos hoy.

1. Dividir por función

Divididos por función, hay cuatro tipos principales de índices:

  • índice normal
  • índice único
  • índice de clave principal
  • índice de texto completo

El índice común es el índice más básico. Este tipo de índice no tiene ningún efecto de restricción. El significado principal de su existencia es mejorar la eficiencia de la consulta.

Los métodos comunes de creación de índices son los siguientes:

CREATE TABLE `user` (
  `id` int(11) unsigned NOT NULL AUTO_INCREMENT,
  `name` varchar(64) DEFAULT NULL,
  PRIMARY KEY (`id`),
  KEY `name` (`name`)
) ENGINE=InnoDB AUTO_INCREMENT=4 DEFAULT CHARSET=utf8mb4;
复制代码

El campo de nombre es un índice ordinario (el nombre del índice está fuera de los corchetes y el campo de índice está dentro).

El índice único agrega la restricción de la exclusividad de los datos al índice ordinario. Pueden existir varios índices únicos en una tabla al mismo tiempo. El índice único se crea de la siguiente manera:

CREATE TABLE `user` (
  `id` int(11) unsigned NOT NULL AUTO_INCREMENT,
  `name` varchar(64) DEFAULT NULL,
  PRIMARY KEY (`id`),
  UNIQUE KEY `name` (`name`)
) ENGINE=InnoDB AUTO_INCREMENT=4 DEFAULT CHARSET=utf8mb4;
复制代码

El campo de nombre es el índice único.

El índice de clave principal agrega una restricción no nula sobre la base del índice único (en otras palabras, el campo al que se agrega el índice único puede contener valores NULL), es decir NOT NULL+UNIQUE, hay como máximo un índice de clave principal en un tabla, por supuesto, un índice de clave principal puede contener varios campos.

En los dos ejemplos anteriores, hay formas de crear un índice de clave principal y no las enumeraré aquí.

De hecho, rara vez usamos la indexación de texto completo en MySQL. Si hay una necesidad de indexación de texto completo en el proyecto, generalmente podemos hacerlo a través de Elasticsearch o Solr. En la actualidad, el más popular es Elasticsearch. Song Ge tiene También grabé un video especial antes. Responda a es en segundo plano para obtener el enlace del tutorial.

También se debe prestar atención a las versiones compatibles con la indexación de texto completo en MySQL:

  • Antes de MySQL 5.6, solo el motor de almacenamiento MyISAM admite la indexación de texto completo.
  • MySQL 5.6 y versiones posteriores, los motores de almacenamiento MyISAM e InnoDB admiten la indexación de texto completo.

创建全文索引对字段类型也有要求,只有字段的数据类型为 CHARVARCHAR 以及 TEXT 等才可以建立全文索引。

MySQL 的全文索引最开始只支持英文,因为英文分词比较方便;中文分词就比较麻烦,所以最早的 MySQL 全文索引是不支持中文的。从 MySQL5.7.6 版本开始,引入了 ngram 全文分析器来解决分词问题,并且这个分词器对 MyISAM 和 InnoDB 引擎都有效。

不过 MySQL 的全文索引并不好用,有这方面的需求还是直接上 Es 吧。

全文索引的创建方式如下:

CREATE TABLE `user` (
  `id` int(11) unsigned NOT NULL AUTO_INCREMENT,
  `name` varchar(64) DEFAULT NULL,
  PRIMARY KEY (`id`),
  FULLTEXT KEY `name` (`name`)
) ENGINE=InnoDB AUTO_INCREMENT=4 DEFAULT CHARSET=utf8mb4;
复制代码

name 字段就是全文索引。

2. 按照物理实现划分

按照物理实现方式,索引可以分为两大类:

  • 聚集索引(有的人也称之为“聚簇索引”)
  • 非聚集索引(有的人也称之为“非聚簇索引”)

2.1 聚集索引

聚集索引在存储的时候,可以按照主键(不是必须,看情况)来排序存储数据,B+Tree 的叶子结点就是完整的数据行,查找的时候,找到了主键也就找到了完整的数据行。

如下图,在聚集索引中,叶子结点保存了每一行的数据。

在聚集索引里,表中数据行按索引的排序方式进行存储,对查找行很有效。只有当表包含聚集索引时,表内的数据行才会按找索引列的值在磁盘上进行物理排序和存储。每张表只能有一个聚集索引,原因很简单,因为数据行本身只能按一个顺序存储。

当我们基于 InnoDB 引擎创建一张表的时候,都会创建一个聚集索引,每张表都有唯一的聚集索引:

  1. 如果这张表定义了主键索引,那么这个主键索引就作为聚集索引。
  2. 如果这张表没有定义主键索引,那么该表的第一个唯一非空索引作为聚集索引。
  3. 如果这张表也没有唯一非空索引,那么 InnoDB 内部会生成一个隐藏的主键作为聚集索引,这个隐藏的主键是一个 6 个字节的列,该列的值会随着数据的插入自增。

基于以上描述大家可以看到,主键索引和聚集索引并不是一回事,切勿混淆!

聚集索引最主要的优势就是查询快。如果要查询完整的数据行,使用非聚集索引往往需要回表才能实现,而使用聚集索引则能一步到位。

不过聚集索引也有一些劣势:

  1. 聚集索引可以减少磁盘 IO 的次数,这在传统的机械硬盘中是很有优势的,不过要是固态硬盘或者内存(有时候为了提高操作效率,数据库服务器会整一个比较大的内存),这个优势就不明显了。
  2. 聚集索引在插入的时候,最好是主键自增,自增主键插入的时候比较快,直接插入即可,不会涉及到叶子节点分裂等问题(不需要挪动其他记录);而其他非自增主键插入的时候,可能要插入到两个已有的数据中间,就有可能导致叶子节点分裂等问题,插入效率低(要挪动其他记录)。如果聚集索引在插入的时候不是自增主键,插入效率就会比较低。

2.2 非聚集索引

非聚集索引我们一般也称为二级索引或者辅助索引,对于非聚集索引,数据库会有单独的存储空间来存放。非聚集索引在查找的时候要经过两个步骤,例如执行 select * from user where username='javaboy'(假设 username 字段是非聚集索引),那么此时需要先搜索 username 这一列索引的 B+Tree,这个 B+Tree 的叶子结点存储的不是完整的数据行,而是主键值,当我们搜索完成后得到主键的值,然后拿着主键值再去搜索主键索引的 B+Tree,就可以获取到一行完整的数据。

所以如果我们在查询中用到了非聚集索引,那么就会搜索两棵 B+Tree,第一次搜索 B+Tree 拿到主键值后再去搜索聚集索引的 B+Tree,这个过程就是所谓的回表。

一张表只能有一个聚集索引,但可以有多个非聚集索引。使用聚集索引的时候,数据的查询效率高,但如果对数据进行插入,删除,更新等操作,效率会比非聚集索引低。

3. 小结

总的来说,数据库索引可以按照两种思路来分类:按照功能分和按照存储方式分。

按照功能分,可以分四种:

  • 普通索引
  • 唯一性索引
  • 主键索引
  • 全文索引

按照存储方式分,可以分两种:

  • 聚集索引
  • 非聚集索引

每种之间有区别又有联系,希望上文能为大家解惑,有问题欢迎留言讨论。

Supongo que te gusta

Origin juejin.im/post/7078512620289916964
Recomendado
Clasificación