数据库优化--库表结构

数据库优化包含三部分:查询优化,索引优化,库表结构。

库表结构:

一般遵循的原则:

  1. 避免过度设计
  2. 使用小而简单的合适数据类型
  3. 尽量使用相同的数据类型存储相似或相关的值
  4. 注意可变长字符串
  5. 尽量使用整形定义定义标识量
  6. 避免使用MySql已经抛弃的特性
  7. 小心使用ENUM和SET,不要滥用。最好避免使用BIT
  8. 范式是好的,但是反范式有时也是必需的
  9. 预先计算,缓存或生成汇总表也可能获得很大的好处

选择优化的数据类型

原则:

  • 更小的通常更好
  • 简单就好
  • 尽量避免NULL

数据类型

  1. 整数类型:有符号和无符号类型使用相同的存储空间,并具有相同的性能,因此可以根据实际情况选择合适的类型。整数计算一般使用64位的BIGINT整数。MySQL可以为整数类型指定宽度,对大多数应用是没有意义的:它不会限制值得合法范围。
  2. 实数类型:带有小数部分的数字,DECIMAL用于存储精确的小数,支持精确计算;FLOAT和DOUBLE类型支持使用标准的浮点运算进行近似计算。浮点类型在存储相同范围的值时,通常比DECIMAL使用更少的空间。因为需要额外的空间和计算开销,所以尽量只在对小数进行精确计算时才使用DECIMAL.
  3. 字符串类型:

    1. VARCHAR和CHAR类型
      1.1. VARCHAR:用于存储可变长字符串,更节省空间。VARCHAR需要使用1或2个额外字节记录字符串的长度:如果列的最大长度小于或等于255字节,则只使用1个字节否则使用两个字节。使用场景:字符串列的长度比平均长度大很多;列的更新很少。
      1.2. CHAR:定长字符串,MySQL总是根据定义的字符串长度分配足够的空间。当存储CHAR值时,MySQL会删除所有的末尾空格。CHAR会根据需要采用空格进行填充进行比较。适合存储很短的字符串或者所有值都接近同一个长度。

    2. BOLB和TEXT类型:存储很大的数据而设计的字符串数据类型,分别采用二进制和字符串方式存储。区别:BLOB存储的是二进制数据,没有排序规则或字符集,而TEXT类型有字符集和排序。不能将 BOLB和TEXT列全部长度的字符串进行索引

    3. 使用枚举代替字符串类型
  4. 日期和时间类型
    DATETIME:保存大范围的值。从1001到9999年,精度为秒。格式:YYYYMMDDHHMMSS,8个字节存储空间。
    TIMETAMP:保存1970年1月1日以来的时间,使用4个字节。范围小得多:1970-2038
  5. 位数据类型
  6. 选择标志符
  7. 特殊数据类型

范式和反范式

完全的范世化和完全的反范式化都是实验室里的东西:在真实的世界中很少这么极端的使用。在实际应用中经常混合使用。

范式:

  1. 第一范式(1NF):所谓第一范式(1NF)是指在关系模型中,对域添加的一个规范要求,所有的域都应该是原子性的,即数据库表的每一列都是不可分割的原子数据项,而不能是集合,数组,记录等非原子数据项。即实体中的某个属性有多个值时,必须拆分为不同的属性。在符合第一范式(1NF)表中的每个域值只能是实体的一个属性或一个属性的一部分。简而言之,第一范式就是无重复的域。
    说明:在任何一个关系数据库中,第一范式(1NF)是对关系模式的设计基本要求,一般设计中都必须满足第一范式(1NF)。不过有些关系模型中突破了1NF的限制,这种称为非1NF的关系模型。换句话说,是否必须满足1NF的最低要求,主要依赖于所使用的关系模型。
  2. 第二范式(2NF):在1NF的基础上,非码属性必须完全依赖于候选码(在1NF基础上消除非主属性对主码的部分函数依赖)。
    第二范式(2NF)是在第一范式(1NF)的基础上建立起来的,即满足第二范式(2NF)必须先满足第一范式(1NF)。第二范式(2NF)要求数据库表中的每个实例或记录必须可以被唯一地区分。选取一个能区分每个实体的属性或属性组,作为实体的唯一标识。例如在员工表中的身份证号码即可实现每个一员工的区分,该身份证号码即为候选键,任何一个候选键都可以被选作主键。在找不到候选键时,可额外增加属性以实现区分,如果在员工关系中,没有对其身份证号进行存储,而姓名可能会在数据库运行的某个时间重复,无法区分出实体时,设计辟如ID等不重复的编号以实现区分,被添加的编号或ID选作主键。(该主键的添加是在ER设计时添加,不是建库时随意添加)第二范式(2NF)要求实体的属性完全依赖于主关键字。所谓完全依赖是指不能存在仅依赖主关键字一部分的属性,如果存在,那么这个属性和主关键字的这一部分应该分离出来形成一个新的实体,新实体与原实体之间是一对多的关系。为实现区分通常需要为表加上一个列,以存储各个实例的唯一标识。简而言之,第二范式就是在第一范式的基础上属性完全依赖于主键。
  3. 第三范式(3NF)
    在2NF基础上,任何非主属性不依赖于其它非主属性(在2NF基础上消除传递依赖)

汇总表和缓存表

缓存表:存储比较简单的从schema其他表获取(但每次获取速度比较慢)数据的表

汇总表:保存的是使用group by语句聚合的数据的表

文中内容摘自:

  1. https://baike.baidu.com/item/%E6%95%B0%E6%8D%AE%E5%BA%93%E8%8C%83%E5%BC%8F/7309898?fr=aladdin
  2. 《高性能MySQL》

猜你喜欢

转载自blog.csdn.net/duiop99/article/details/80754883