MySQL技术专题之MySQL分布式系统架构设计偏向扩容问题+业务拆分

「这是我参与2022首次更文挑战的第22天，活动详情查看：2022首次更文挑战」。

随着数据量的不断增长，数据库的发展主要经历以下几个步骤：

可以将业务库划分成16个库，每个库64个表进行存储，总共1024个表，MySQL单表性能超过千万级别会导致性能严重下降，假设按千万计算，最高可以存储百亿级数据量。随着存储问题的解决，但复杂度会随着增加：

例如：商城购物的订单中心，当买家查询订单时，应该去哪个库哪个表里查找，卖家应该去哪查；再大的存储量，随着数据量的增长，终究是会遇到瓶颈，该怎么扩容。

采用Twitter snowflake方案，全剧唯一ID生成由：时间戳+机器ID+自增序列（+userid后两位）；

订单的生成过程直接在应用实例中生成，直接在内存中计算，且计算过程分散到每台应用实例中，解决性能问题，userid后两位在后面解释。

分库分表后，要连接数据库变的复杂起来，分为两种方案：

此种方式需要在应用代码中，自己计算订单应该进入哪个库，可取订单的后两位，先对库16进行取模，再对表64取模，从而确定。优点是直连数据库性能更好，缺点是代码复杂度增加。

服务中间价可以使用阿里的mycat连接，具体使用查看mycat文档。优点：代码实现简单，跟分库前差不多。

用户需要查询数据的时候，只有userid，并不知道数据存在哪个库哪张表中，从每个库每个表中遍历一遍不现实。所以还要对唯一编号进行改进，之前是：时间戳+机器ID+自增序列。现在此ID的后面加上userid的后两位，时间戳+机器ID+自增序列+userid后两位。

例如：订单入库取模的后两位即userid后两位，即同一个买家的所有订单都会存入同一个表中，通过此设计买家即可找到订单号应该在哪个表中。

此方案已经不是单纯的通过订单号查找订单，还需要通过userid查找订单，其次是订单具有时间特性，用户查询的大部分都是最近的订单，3月前的订单很少会查看，所以不适合进行扩容，特别适合迁移历史数据，将3个月前的数据迁移到历史数据库中，从而解决容量增长的问题。

业务极其复杂，不只是订单号的生成插入等，还要减库存、支付等一系列的操作。所以应该通过消息队列将业务进行拆分，本步骤只做订单生成的操作，通过消息队列实现数据的最终一致性。