MySQL 数据库规范

以下数据库规范，很重要，源自阿里巴巴的开发手册

建表规约

表达是与否概念的字段，必须使用 is_xxx 的方式命名，数据类型是 unsigned tinyint （1 表示是，0 表示否）。

说明：任何字段如果为非负数，必须是 unsigned。注意：任何布尔类型的变量，都不要加 is 前缀。数据库表示是与否的值，使用 tinyint 类型，坚持 is_xxx 的命名方式是为了明确其取值含义与取值范围。

正例：表达逻辑删除的字段名 is_deleted，1 表示删除，0 表示未删除。

表名、字段名必须使用小写字母或数字，禁止出现数字开头，禁止两个下划线中间只出现数字。数据库字段名的修改代价很大，因为无法进行预发布，所以字段名称需要慎重考虑。

说明：MySQL 在 Windows 下不区分大小写，但在 Linux 下默认是区分大小写。因此，数据库名、表名、字段名，都不允许出现任何大写字母，避免节外生枝。

正例：aliyun_admin，rdc_config，level3_name
反例：AliyunAdmin ，rdcConfig ，level_3_name

表名不使用复数名词。

说明：表名应该仅仅表示表里面的实体内容，不应该表示实体数量，符合表达习惯。

禁用保留字。

如 desc、range、match、delayed 等，请参考 MySQL 官方保留字。

主键索引名为 pk_字段名；唯一索引名为 uni_字段名；普通索引名则为 idx_字段名。

说明：pk_ 即 primary key；uni_ 即 unique key；idx_ 即 index 的简称。

小数类型统一使用decimal。

如果存储的字符串长度几乎相等，使用 char 定长字符串类型

字段为varchar长度超过 2000，需要独立出来一张表，用主键来对应，避免影响其它字段索引效率,且不能创建任何索引。

表必备三字段：id, create_time, update_time

说明：其中 id 必为主键，类型为 bigint unsigned、单表时自增、步长为 1。
create_time, update_time 的类型均为 datetime 类型，前者现在时表示主动创建，后者以过去分词表示被动更新。
`update_time` datetime NOT NULL DEFAULT current_timestamp() ON UPDATE current_timestamp() COMMENT '最后更新时间',
create_time 可以程序控制。

表名和字段名必须要有comment来备注说明含义

不要使用mysql枚举类型

所有字段都应该包含 not null, default默认值

自增主键类型为BIGINT 避免以后溢出

金额统一使用amount名，类型为decimal, 确保精度没损失

一个表字段数量控制在24个以内超出部分按照垂直功能拆分

删除使用软删除，且字段为命名为is_delete，建议根据场景来选择

索引规约

业务上具有唯一特性的字段，即使是多个字段的组合，也必须建成唯一索引。

说明：不要以为唯一索引影响了 insert 速度，这个速度损耗可以忽略，但提高查找速度是明显的；另外，即使在应用层做了非常完善的校验控制，只要没有唯一索引，根据墨菲定律，必然有脏数据产生。

超过三个表禁止 join。需要 join 的字段，数据类型必须绝对一致；多表关联查询时，保证被关联的字段需要有索引。（根据业务进行调整）

说明：即使双表 join 也要注意表索引、SQL 性能。业务上不建议使用表关联，在后台中使用时要注意场景的划分，只有同功能集合或同业务属性下进行表关联

在 varchar 字段上建立索引时，必须指定索引长度，没必要对全字段建立索引，根据实际文本区分度决定索引长度即可。

说明：索引的长度与区分度是一对矛盾体，一般对字符串类型数据，长度为 20 的索引，区分度会高达 90%以上，可以使用 count(distinct left(列名, 索引长度))/count(*) 的区分度来确定。

页面搜索严禁左模糊或者全模糊，如果需要请走搜索引擎来解决。

说明：索引文件具有 B-Tree 的最左前缀匹配特性，如果左边的值未确定，那么无法使用此索引。只限使用 like 'Frank%'这种模式。

如果有 order by 的场景，请注意利用索引的有序性。order by 最后的字段是组合索引的一部分，并且放在索引组合顺序的最后，避免出现 file_sort 的情况，影响查询性能。

正例：where a=? and b=? order by c;
索引：a_b_c
反例：索引中有范围查找，那么索引有序性无法利用。
如：WHERE a>10 ORDER BY b; 索引 a_b 无法排序。

利用覆盖索引来进行查询操作，避免回表。

回表的意思：比如一个执行计划（QEP），先索引扫描，再通过 rowid 去取索引中未能提供的数据，即为回表。

说明：如果一本书需要知道第 11 章是什么标题，会翻开第 11 章对应的那一页吗？目录浏览一下就好，这个目录就是起到覆盖索引的作用。

正例：能够建立索引的种类分为主键索引、唯一索引、普通索引三种，而覆盖索引只是一种查询的一种效果，用 explain 的结果，extra 列会出现：using index。

利用延迟关联或者子查询优化超多分页场景。

说明：MySQL 并不是跳过 offset 行，而是取 offset+N 行，然后返回放弃前 offset 行，返回 N 行，那当 offset 特别大的时候，效率就非常的低下，要么控制返回的总页数，要么对超过特定阈值的页数进行 SQL 改写。

正例：先快速定位需要获取的 id 段，然后再关联： SELECT a.* FROM 表 1 a, (select id from 表 1 where 条件 LIMIT 100000,20 ) b where a.id= b.id

SQL 性能优化的目标：至少要达到 range 级别，要求是 ref 级别，如果可以是 consts 最好。

说明：
1）consts 单表中最多只有一个匹配行（主键或者唯一索引），在优化阶段即可读取到数据。
2）ref 指的是使用普通的索引（normal index）。
3）range 对索引进行范围检索。反例：explain 表的结果，type = index，索引物理文件全扫描，速度非常慢，这个 index 级别比较 range 还低，与全表扫描是小巫见大巫。

建组合索引的时候，区分度最高的在最左边。

正例：如果 where a = ? and b = ? ，如果 a 列的几乎接近于唯一值，那么只需要单建 idx_a 索引即可。

说明：查询中非等号和等号混合存在时，在建索引时，请把等号条件的列前置。如：where c > ? and d = ? 那么即使 c 的区分度更高，也必须把 d 放在索引的最前列，即索引 idx_d_c。

一张表索引数量最多不能超过5个，避免数据库维护无用索引导致数据库负载加大

SQL 语句

在代码中写分页查询逻辑时，若 count 为 0 应直接返回，避免执行后面的分页语句。
禁止使用存储过程，存储过程难以调试和扩展，更没有移植性。
数据订正（特别是删除、修改记录操作）时，要先 select，且需要加上 limit 来控制影响函数，避免出现误删除，确认无误才能执行更新语句。
in 操作能避免则避免，若实在避免不了，需要仔细评估 in 后边的集合元素数量，控制在 200 个之内。
如果有国际化需要，所有的字符存储与表示，均以 utf8mb4 编码，注意字符统计函数的区别。
TRUNCATE TABLE 比 DELETE 速度快，且使用的系统和事务日志资源少，但TRUNCATE 无事务且不触发 trigger，有可能造成事故，故不建议在开发代码中使用此语句。说明：TRUNCATE TABLE 在功能上与不带 WHERE 子句的 DELETE 语句相同。

在表查询中，一律不要使用 * 作为查询的字段列表，需要哪些字段必须明确写明。
在表查询中，不要使用 mysql 字符串函数。
INSERT .. ON DUPLICATE 尽量不对存在多个唯一键的 table 使用该语句且在有可能有并发事务执行的 insert 的内容一样情况下不使用该语句。

建表规约

索引规约

SQL 语句

猜你喜欢