1.什么是索引?
索引是帮助获取数据的数据结构,排好序的快速查找就是索引。
2.建立索引的数据结构
在数据之外,数据库系统还维护着满足特定查找算法的数据结构,这些数据结构以某种方式引用(指向)数据。这样就可以在这些数据结构上实现查找算法,这种数据结构,就是索引。
3.索引的存储位置
一般来说索引很大,不可能全部村存储在内存中,因此索引以索引文件的形式存储在磁盘上。
4.建立索引的优势和劣势
优势:①提高数据库的检索效率,降低数据库的IO成本。②通过索引对数据库进行排序,降低数据排序的成本,降低了CPU的消耗。
劣势:①索引也是一张表,该表保存了主键和索引字段,并指向实体表的记录,所以索引列也是要占用空间的。②索引大大提高了查询速度,同时降低了表的更新速度。(因为更新表,MYSQL不仅要保存数据,还要更新索引字段)③索引只是提高效率的一个因素,如果MYSQL有大数据量的表就需要建立最有效的索引。
5.索引的分类以及创建语句
-单值索引:既一个索引只包含单个列,一个表可以有多个单列索引
-唯一索引:索引列的值必须唯一,但允许有空值。
-复合索引:一个索引包含多个列。
-基本语法:
-创建:
-create [unique] INDEX indexname ON mytable(columnname(length));
-ALTER mytable ADD [UNIQUE] INDEX [indexname] ON (columnname(length));
-删除:drop INDEX [indexname] ON mytable;
-查看:show INDEX FROM table_name;
-使用ALTER命令,四种方式添加数据表的索引:
ALTER TABLE tbl_name ADD PRIMARY KEY (column_list);该句添加一个主键,这意味着索引值必须是唯一的,且不能为null
ALTER TABLE tbl_name ADD UNIQUE index_name (column_list);该句创建索引的值必须是唯一的(除了NULL,NULL可能出现多次)
ALTER TABLE tbl_name ADD INDEX index_name (column_list);添加普通索引,索引值可出现多次
ALTER TABLE tbl_name ADD FULLTEXT index_name (column_list);指定索引为FULLTEXT,用于全文索引
6.索引的结构
BTree 索引:主修
hash索引
full-text全文索引
R-tree索引
7.哪些情况下应该建立索引
1.主键自动建立唯一索引
2.频繁作为查询条件的字段应该创建索引。
3.查询中与其他表关联的字段,外键关系建立索引
4.频繁更新的字段不适合建立索引
5.where条件里用不到的字段不创建索引
6.单件/组合索引的选择问题:(在高并发下创建组合索引)
7.查询中排序的字段,排序字段若通过索引访问将提高访问速度。
8.查询中统计或者分组字段(group by)
8.哪些情况下不应该建索引
1.表记录太少
2.经常增删改的表
3.数据重复的列
简单使用索引
1.1 单值索引
create index idx_user_name on user(name);
1.2 复合索引
create idx_user_nameEmail on user(name,email);
9.性能分析
1.mysql查询优化(mysql的内部架构)
2.mysql常见瓶颈
2.1 CPU达到饱和
2.2 IO负载过大
2.3 服务器硬件性能瓶颈
3. Explain:使用Explain关键字可以模拟优化器执行MYSQL查询语句,从而知道MYSQL如何处理你的SQL语句的。分析你的查询语句或者是表结构的性能瓶颈。
3.1:能干嘛?
1.表的读取顺序
2.数据读取操作的操作类型
3.哪些索引可以使用
4.哪些索引被实际使用
5.表之间的引用
6.每张表有多少行被优化器查询
3.2 使用
Explain+SQL语句
3.3 查询包含信息
id select_type table type possible_keys key key_len ref rows extra
3.4 字段解释
id:select查询的序列号,包含一组数字,表示查询中执行的select子句或操作表的顺序
1. 三种情况:
1.1 id相同,执行顺序从上到下
1.2 id不同,如果是子查询,id的序号递增,id值越大优先级越高,越先被执行。
1.3 id相同不同,同时存在。
select——type:查询方式
-simple:简单的select查询,查询中不包括子查询或者union
-primary:查询中若包含任何复杂的子部分,这是最外层查询的标记。
-subquery:在select或where列表中添加了子查询
-derived:在from列表中包含的子查询被标记为derived(衍生),MySQL会递归执行这些子查询,把结果放在临时表中
-union 若第二个select出现在union之后,则被标记为union;
若union包含在from子句中,外层select被标记为derived
-union result:从union表获取select。
table:显示这一行数据关于哪张表。
type:访问类型
-从最好到最差依次是:
system>const>eq_ref>ref>range>index>ALL(一般来说,得保证查询至少达到range级别,最好达到ref)
system:表只有一行记录(等于系统表),这是const类型的特例,平时不会出现。
const:表示通过索引一次就找到了,const用于比较primary key或者unique索引。因为只匹配一行数据,所以很快。比如将主键置于where列表中,MYSQL就能将该查询转化为一个常量。
eq_ref:唯一性索引扫描,对于每个索引键,表中只有一条记录与之匹配。常见于主键或唯一索引扫描
ref:非唯一性索引扫描,返回匹配某个单独值的行,然而他可能找到多个符合条件的行,所以它属于查找和扫描的混合体。
range:只检索给定范围的行,使用一个索引来选择行。key列显示使用了哪个索引,一般就是在你的where语句中出现了between,<,>,in等的查询。这种扫描比全表查询好。
index:全索引扫描,只遍历索引树,这通常比ALL快。
all:属于全表查询
possible_keys(理论索引)和key(实际索引)
possible_keys:显示可能应用在这张表中的索引,一个或者多个查询涉及的字段上若存在索引,则该索引将被列出,但不一定在实际查询中应用。
key:实际使用的索引,如果为NUL L,则没有使用索引。②查询中若使用了覆盖索引(查询的字段和我的复合索引字段顺序数量完全一致),则该索引仅出现在key列表中。
key_len:表示索引中使用的字节数,可通过该列计算查询中使用的索引的长度,在不损失精确性的情况下,长度越短越好。key_len显示的值是索引字段的最大可能长度,并非实际长度,既key_len根据表的计算得来的,不是通过表内检索出来的。(同样的查询结果精度越小越好)。
ref:显示索引的哪一列被使用了,如果可能的话,是一个常数。哪些列或常量被用于查找索引列上的值。
row:找到所需的记录数读取的行数。
Extra:包含不适合在其他列显示但是十分重要的信息。
1.using filesort:说明mysql会对数据使用一个外部的索引排序,而不是按照表内的索引顺序进行读取。MySQL无法利用索引完成的排序操作称为”文件排序“。(出现了filesort是一种不好的现象)
2.using temporary:使用了临时表保存中间结果,mysql在对查询结果排序时使用临时表。常见于排序order by和分组查询group by
3.using index:表示相应的select操作使用了覆盖索引,避免了表的数据行,效率不错。如果同时出现using where,表明索引被用来执行索引键值的查找。如果没有同时出现using where,表明索引用来读取数据而非执行查找动作。
、
解释索引覆盖:就是select查询的字段就是索引的字段,不必读取数据行。
4.using where 表明使用了where
5.using join buffer 使用了连接缓存
6.impossible where:where子句的值总是false,不能用来获取任何元组。
7.select tables optimized away 在没有使用groupby子句下使用min/max操作,使用myisam下的count(*).
8.distinct:优化distinct操作,在找到第一匹配的元组之后即停止找同样值的操作。