MySql表、约束、视图
索引组织表
在InnoDB存储引擎中,表都是根据主键顺序组织存放的,这种存储方式的表成为索引组织表(index organized table)。
每张表都有主键,如果创建表的时候没设置主键,会采取以下方式:
1. 是否有非空唯一索引,如果有,选为主键
2. 如果没有非空唯一索引,则InnoDB存储引擎自动创建一个6字节的指针
在1的情况下主键的选择是根据定义索引的顺序,而不是建表时列的顺序选主键。
Create table student(
stu_id int not null,
stu_mobile varchar(11) null,
stu_no varchar(20) not null,
stu_cert_id varchar(18) not null
unique key (stu_mobile),
unique key (stu_cert_id),
unique key (stu_no)
)
主键会是stu_cert_id,而不是stu_mobile和stu_no
如果主键是但字段,可以通过select _rowid from table,查询主键;
如果主键是联合主键,则_rowid失效。
InnoDB逻辑存储结构
所有数据都被逻辑的存放在表空间中。
表空间由segment(段)、extend(区)、page(页)组成。
如果innodb_file_per_table未设置为ON,则所有表共享一个表空间ibdata1;如果设置为ON,则每张表维护一个表空间,但共享表空间中依然会存放各个表的一些数据。
区是由连续页组成的空间,大小为1MB。
默认情况下页的大小是16KB,即一个区中有64个页。但是新版本的InnoDB,支持通过设置KEY_BLOCK_SIZE来改变每个页的大小为2KB、4KB、8KB(有时候也会称页为块block);或者设置innodb_page_size设置页为4KB、8KB。区别是前者KEY_BLOCK_SIZE引入压缩页,后者不压缩。
页是InnoDB磁盘管理的最小单位。
每个页最多存放16KB/2-200行记录,即7992行记录。
InnoDB行记录格式
InnoDB存储引擎提供了以下几种格式来存放行记录数据
1. compact
2. redundant
3. compressed
4. dynamic
(一) compact行记录格式如下:
变长字段长度列表 |
NULL标志位 |
记录头信息 |
列1数据 |
列2数据 |
… |
事务ID列 |
回滚指针列 |
Rowed |
min1字节 max2字节 |
1字节 |
5字节 |
|
|
|
隐藏列 6字节 |
隐藏列 7字节 |
未设置主键 6字节 |
(1) 变长字段长度列表:按照列的顺序的逆序放置。
(2) NULL标志位:如果该行中有字段为null值,则用1表示
(3) 列数据后还有两列隐藏列,分别是事务ID和回滚指针列,分别是6字节和7字节
(4) 如果没有设置主键,每行还会增加一个6字节的rowid列
(二) Redundant行记录格式
为了兼容老的版本的页格式。略。
(三) Compressed和Dynamic行记录格式
这两种格式对于存放blob类型的数据,才用了完全的行溢出的方式。而Compact和Redundant两种格式会存放768个前缀字节,其余的存放在blob页类型中。
Compressed行记录格式,采用zlib算法进行压缩,对大字符存储有利。
行溢出数据
InnoDB存储引擎会将一些特别大的字段的值存储在数据页面之外,这就是所谓的行溢出数据。
MySql的varchar类型可以存放65535字节,但是建表的时候定义字段类型varchar(N),N指的是字段长度,这里的N并不是代表N字节,并且N值该表中所有字段长度之和是N。
举例:
如果数据库charset是latin1,建表支持长度约为varchar(65532),即N=65532,会有部分其他的开销。
如果数据库charset是gbk,建表支持长度约为varchar(32766) ,即N=32766
如果数据库charset是utf-8,建表支持长度约为varchar(21844) ,即N=21844
InnoDB存储引擎的页默认大小为16KB,即16384字节,怎么存放65535字节呢?数据都存放在页类型为B-tree Node中,当时当发生行溢出时,数据会存放在页类型为Uncompress BLOB页中。
如果定义表只有一个字段,且长度是65532如下:
Create table show_innoDB_feature1(
a varchar(65532)
)engine=InnoDB charset=latin1
通过工具分析,得知存储的行逻辑结构如下:
…… |
Prefix 768bytes |
偏移量 |
…… |
偏移量指向blob page
InnoDB存储引擎表示索引组织的,即B+Tree的结构,所以每个野种至少应该有两条行记录。
注意以下两点:
varchar类型如果不是特别大,会存在B-tree Node页类型中,如果超过一定长度,则会有部分数据存储在uncompressed blob页类型中;
Blob类型字段如果存字符串不是特别大,也会会存在B-tree Node页类型中,如果超过一定长度,则会有部分数据存储在uncompressed blob页类型中。
Char在多字节字符集下(GBK、UTF-8)跟varchar实际存储是没有区别的。
约束
关系型数据库本身就可以保证数据的完整性。
数据完整性是由约束这一机制来得到保证的。
数据完整性,包含以下三种:
1. 实体完整性
目的:保证表中有一个主键。
手段:通过设置primary key 或者unique key或者编写触发器来实现
2. 域完整性
目的:保证每列的值满足一定的条件
手段:选择合适数据类型、外键约束、触发器、default约束
3. 参照完整性
目的:保证两张表之间的关系
手段:外键、触发器
约束的类型有:
Primary key
Unique key
Foreign key
Default
Not Null
约束和索引的区别:
1. 约束是一个逻辑概念,用来保证数据的完整性
2. 索引是一个数据结构,既有逻辑上的概念,又在数据库中代表着物理存储的方式。
视图
视图是一个命名的虚表,视图中的数据没有实际的物理存储,视图在一定程度上起到一个安全层的作用。
物化视图是把数据存到非易失的存储设备上,但mysql没有物化视图,可以通过建表加上触发器实现物化视图。
分区表
Mysql数据库支持以下几种类型的分区:
1. Range分区
2. List分区
3. Hash分区
4. Key分区
以上分区限定分区依据字段为整型,如果为非整型,可加关键字columns,例如:
Create … (…)ENGINE=InnoDB
Partition by range cloumns (a)
Partition p0 …
Partition p1 …
Mysql对于Null值的处理:认为null是小于任何非空的字段。(所以排序、分区都会把null放在最小)