MySQL内部搜索引擎

面试时突然被问到这个问题,非常懵,以前一直都没有注意过这个问题,今天整理一下

什么是存储引擎

关系数据表是用于存储和组织信息的数据结构,可以将表理解为由行和列组成的表格,类似于excel的电子表格的形式。有的表简单,有的表复杂,有的表根本不用来存储任何长期的数据,有的表读取时非常快,但是插入数据时很差;而在我们实际开发过程中,就可能需要各种各样的表,不同的表,就意味着存储不同类型的数据,数据的处理上也会存在着差异。
对于MySQL来说,它提供了很多种类型的存储引擎,我们可以根据对数据处理的需求,选择不同的存储引擎,从而最大限度的利用MySQL强大的功能。
mysql5.5以后,默认使用InnoDB搜索引擎 若要修改默认引擎,可以修改配置文件中的default-storage-engine。
可以通过show variables like ‘default_storage_engine’,查看当前数据库的默认引擎。
image
命令:show engines和show variables like ‘have%’可以列出当前数据库支持的引擎,其中value显示为disabled的记录表示数据库支持此引擎,而在数据库启动时被禁用。
image
在MySQL5.1以后,information_chema数据库中存在一个engines的表,它提供的信息与show engines语句完全一样,可以使用下面语句来查询存储引擎支持哪些事务处理:select engine from information_chema.engines where transactions=’yes’ 。可以通过engine关键字在创建或修改数据库时指定所使用到的引擎
在创建表的时候通过engine=…或type=…来指定所使用到的引擎。show table status from DBname来查看指定表的引擎
主要搜索引擎:MyISAM,InnoDB,MEMORY和MERGE

MyISAM:

MyISAM是独立于操作系统的,这说明可以轻松地将其从windows服务器移植到Linux服务器;每当我们建立一个MyISAM引擎的表时,就会在本地磁盘上建立三个文件,文件名就是表名,例如建立一个MyISAM引擎的tb_Demo表,就会生成以下三个文件:

文件名 意义
tb_demo.frm 存储表定义
tb_demo.MYD 存储数据
tb_demo.MYI 存储索引

不适用场景:MyISAM表无法处理事务,这就意味着有事务处理需求的表,不能使用MyISAM存储引擎。
适用场景
- 选择密集型的表。MyISAM存储引擎在筛选大量数据时非常迅速,这是他最突出的优点
- 插入密集型的表。MyISAM的并发插入特性允许同时选择和插入数据。例如:MyISAM存储引擎很适合管理邮件或者web服务器日志数据。

InnoDB

InnoDB是一个健壮的事务性存储引擎,这种存储引擎已经被很多互联网公司使用,为用户操作非常大的数据存储提供了一个强大的解决方案。
InnoDB 还引入了行级锁定和外键约束,在以下场合中使用InnoDB是最理想的选择。
- 更新密集的表,他特别适合处理多重并发的更新请求
- 事务,innoDB存储引擎是支持事务的标准mySQL存储引擎
- 自动灾难恢复,与其他存储引擎不同,innodb能自动从灾难中恢复
- 外键约束,mysql支持外键的存储引擎只有innoDB
- 支持自动增加列AUTO_INCREMENT属性
一般来说,如果需要事务支持,并且有较高的并发读取效率,InnoDB是不错的选择。

MEMORY

使用 MySQL Memory存储引擎的出发点是速度。为得到最快的响应时间,采用的逻辑存储介质是系统内存。虽然在内存中存储表数据确实会提高很高的性能,但当mysqld守护进程崩溃时,所有memory数据都会丢失。获得速度的同时也会带来一些缺陷。他要求存储在memory数据表里的数据使用的长度不变的格式,这意外着不能使用BLOB和TEXT这样的长度可变的数据类型,VARCHAR是一种长度可变的类型,但因为它在MySQL内部当作长度固定不变的CHAR类型,所以可以使用。
一般在以下几种情况使用Memory存储引擎:
- 目标数据较小,而且被频繁的访问。在内存中存放数据,所以会造成内存的使用,可以通过参数max_heap_table_size控制Memory表的大小,设置此参数,就可以限制Memory表的最大大小;
- 如果数据是临时的,而且要求立即可用,就可以存放在内存表中
- 存储在Memory表中的数据如果突然丢失,不会对应用服务产生实质的负面影响
- Memory同时支持散列索引和B树索引。B树索引的优于散列索引的是,可以使用部分查询和通配查询,也可以使用<、>和>=等操作符方便数据挖掘。散列索引进行“相等比较”非常快,但是对“范围比较”的速度就慢多了,因此散列索引值适合使用在=和<>的操作符中,不适合在<或>操作符中,也同样不适合用在order by子句中

MERGE

MERGE 存储引擎是一组MyISAM表的组合,这些MyISAM表结构必须完全相同,尽管其使用不如其他引擎突出,但是某些情况下非常有用,说白了,merge表就是几个相同MyISAM表的聚合器
Merge表中并没有数据,对merge类型的表可以进行查询、更新、删除操作,这些操作实际上是对内部的MyISAM表进行操作。
Merge存储引擎的使用场景
对于服务器日志这种信息,一般常用的存储策略是将数据分成很多表,每个名称与特定的时间段相关。例如,可以用12个相同的表来存储服务器日志数据,每个表对应各个月份的名字来命名,当有必要基于所有12个日志表的数据生成报表,这意味着需要编写并更新多表查询,以反映这些表中的信息。与其编写这些可能出现错误的查询,不如将这些表合并起来使用一条查询,之后再删除Merge表,而不影响原来的数据,删除merge表知识删除merge表的定义,对内部的表没有任何影响
ARCHIVE
Archive+是归档的意思,在归档之后很多高级功能就不再支持了,仅仅支持最基本的插入和查询两种功能。MySQL5.5版以前,Archive是不支持索引,但是在MySQL5.5以后的版本中就开始支持索引了
Archive拥有很好的压缩机制,它使用zlib压缩库,在记录被请求时会实时压缩,所以它经常被用来当做仓库使用。

如何使用合适的存储引擎?

  • 是否需要支持事务
  • 是否需要使用热备
  • 崩溃恢复:能否接受崩溃
  • 是否需要外键支持

猜你喜欢

转载自blog.csdn.net/guotingting923/article/details/80489462