1 count(*)的实现方式

在不同的MySQL引擎中，count(*)有不同的实现方式。

MyISAM引擎把一个表的总行数存在了磁盘上，执行count(*)的时候会直接返回这个数，效率很高；
InnoDB引擎执行count(*)的时候，需要把数据一行一行地从引擎里面读出来，然后累积计数。

如果加了where 条件的话，MyISAM表也是不能返回得这么快的。

为什么InnoDB不跟MyISAM一样，也把数字存起来呢？ 因为即使是在同一个时刻的多个查询，由于多版本并发控制（MVCC）的原因，InnoDB表“应该返回多少行”也是不确定的。

假设表t中现在有10000条记录，设计三个用户并行的会话。

会话A先启动事务并查询一次表的总行数；
会话B启动事务，插入一行后记录后，查询表的总行数；
会话C先启动一个单独的语句，插入一行记录后，查询表的总行数。

在这里插入图片描述

图1 会话A、B、C的执行流程

在最后一个时刻，三个会话A、B、C会同时查询表t的总行数，拿到的结果不同。

这和InnoDB的事务设计有关系，默认的隔离级别可重复读，在代码上就是通过MVCC。每一行记录都要判断自己是否对这个会话可见，因此对于count(*)请求来说，InnoDB只好把数据一行一行地读出依次判断，可见的行才能够用于计算基于这个查询的表的总行数。

MySQL在执行count(*)操作的时候也做了优化。 InnoDB是索引组织表，主键索引树的叶子节点是数据，普通索引树的叶子节点是主键值所以比主键索引树小。对于count(*)这样的操作，遍历哪个索引树得到的结果逻辑上都是一样的。因此，MySQL优化器会找到最小的那棵树来遍历。

show table status 命令的输出结果里面也有一个TABLE_ROWS用于显示这个表当前有多少行，这个命令执行挺快的。

索引统计的值是通过采样来估算的。实际上，TABLE_ROWS就是从这个采样估算得来的，因此它也很不准。官方文档说误差可能达到40%到50%。所以，show table status命令显示的行数也不能直接作为count(*)来使用。

MyISAM表虽然count(*)很快，但是不支持事务；
show table status命令虽然返回很快，但是不准确；
InnoDB表直接count(*)会遍历全表，虽然结果准确，但会导致性能问题。

如果现在有一个页面经常要显示交易系统的操作记录总数，我们只能自己计数。基本思路是要自己找一个地方，把操作记录表的行数存起来。

2 用缓存系统保存计数

可以用一个Redis服务来保存这个表的总行数。这个表每被插入一行Redis计数就加1，每被删除一行Redis计数就减1。这种方式下，读和更新操作都很快。

But，缓存系统可能会丢失更新。

实际上，即使Redis正常工作，这个值还是逻辑上不精确的。

例如：有一个要显示操作记录的总数的页面，同时还要显示最近操作的100条记录。那么，这个页面的逻辑就需要先到Redis里面取出计数，再到数据表里面取数据记录。

不精确体现如下：

查到的100行结果里面有最新插入记录，而Redis的计数里还没加1；
查到的100行结果里没有最新插入的记录，而Redis的计数里已经加了1。

在这里插入图片描述

图2 会话A、B执行时序图

在T3时刻会话B来查询的时候，会显示出新插入的R这个记录，但是Redis的计数还没加1。把会话A的更新顺序换一下，都是先操作redis，然后再操作数据。在这里插入图片描述图3 调整顺序后，会话A、B的执行时序图

会话B在T3时刻查询的时候，Redis计数加了1了，但还查不到新插入的R这一行。并发系统无法精确控制不同线程的执行时刻，因为存在图中的这种操作序列，所以，即使Redis正常工作，这个计数值还是逻辑上不精确的。

3 在数据库保存计数

使用redis的话两个不同的存储构成的系统，不支持分布式事务，无法拿到精确一致的视图

如果把这个计数直接放到数据库里单独的一张计数表C中，会怎么样？

首先解决了崩溃丢失的问题，InnoDB是支持崩溃恢复数据的。
对于计数不精确的问题，可以利用事务的特性来解决这个问题。

在这里插入图片描述

图4 会话A、B的执行时序图

虽然会话B的读操作仍然是在T3执行的，但是因为这时候更新事务还没有提交，计数值加1这个操作对会话B还不可见。

会话B看到的结果里，查计数值和“最近100条记录”看到的结果，逻辑上就是一致的。

4 不同的count用法的性能区别

count(*)、count(主键id)和count(1) 都表示返回满足条件的结果集的总行数；而count(字段），则表示返回满足条件的数据行里面，参数“字段”不为NULL的总个数。

分析性能差别的时候，有这样几个原则：

server层要什么就给什么；
InnoDB只给必要的值；
现在的优化器只优化了count(*)的语义为“取行数”。

4.1 count(主键id)

InnoDB引擎会遍历整张表，把每一行的id值都取出来，返回给server层。server层拿到id后，判断不为空，按行累加。

4.2 count(1)

InnoDB引擎遍历整张表，但不取值。server层对于返回的每一行，放一个数字“1”进去，判断不为空，按行累加。

count(1)执行得要比count(主键id)快。因为从引擎返回id会涉及到解析数据行，以及拷贝字段值的操作。

4.3 count(字段)

如果这个“字段”是定义为not null的话，一行行地从记录里面读出这个字段，判断不能为null，按行累加；
如果这个“字段”定义允许为null，那么执行的时候，判断到有可能是null，还要把值取出来再判断一下，不是null才累加。

前面的第一条原则：server层要什么字段，InnoDB就返回什么字段。

4.4 count(*)是例外

并不会把全部字段取出来，而是专门做了优化，不取值。count(*)肯定不是null，按行累加。

结论：按照效率排序的话，count(字段) < count(主键id) < count(1) ≈ count(*)，因此建议尽量使用count(*)。

MySQL 的 count(*)太慢了该怎么办？

1 count(*)的实现方式

2 用缓存系统保存计数

3 在数据库保存计数

4 不同的count用法的性能区别

4.1 count(主键id)

4.2 count(1)

4.3 count(字段)

4.4 count(*)是例外

Guess you like