MySQL 的 count(*)太慢了该怎么办?

1 count(*)的实现方式

在不同的MySQL引擎中,count(*)有不同的实现方式。

  • MyISAM引擎把一个表的总行数存在了磁盘上,执行count(*)的时候会直接返回这个数,效率很高;
  • InnoDB引擎执行count(*)的时候,需要把数据一行一行地从引擎里面读出来,然后累积计数。

如果加了where 条件的话,MyISAM表也是不能返回得这么快的。

为什么InnoDB不跟MyISAM一样,也把数字存起来呢?   因为即使是在同一个时刻的多个查询,由于多版本并发控制(MVCC)的原因,InnoDB表“应该返回多少行”也是不确定的。

假设表t中现在有10000条记录,设计三个用户并行的会话。

  • 会话A先启动事务并查询一次表的总行数;
  • 会话B启动事务,插入一行后记录后,查询表的总行数;
  • 会话C先启动一个单独的语句,插入一行记录后,查询表的总行数。

在这里插入图片描述

图1 会话A、B、C的执行流程

  在最后一个时刻,三个会话A、B、C会同时查询表t的总行数,拿到的结果不同。

  这和InnoDB的事务设计有关系,默认的隔离级别可重复读,在代码上就是通过MVCC。每一行记录都要判断自己是否对这个会话可见,因此对于count(*)请求来说,InnoDB只好把数据一行一行地读出依次判断,可见的行才能够用于计算基于这个查询的表的总行数。

MySQL在执行count(*)操作的时候也做了优化。   InnoDB是索引组织表,主键索引树的叶子节点是数据,普通索引树的叶子节点是主键值所以比主键索引树小。对于count(*)这样的操作,遍历哪个索引树得到的结果逻辑上都是一样的。因此,MySQL优化器会找到最小的那棵树来遍历。

show table status 命令的输出结果里面也有一个TABLE_ROWS用于显示这个表当前有多少行,这个命令执行挺快的。

  索引统计的值是通过采样来估算的。实际上,TABLE_ROWS就是从这个采样估算得来的,因此它也很不准。官方文档说误差可能达到40%到50%。所以,show table status命令显示的行数也不能直接作为count(*)来使用。

  • MyISAM表虽然count(*)很快,但是不支持事务;
  • show table status命令虽然返回很快,但是不准确;
  • InnoDB表直接count(*)会遍历全表,虽然结果准确,但会导致性能问题。

  如果现在有一个页面经常要显示交易系统的操作记录总数,我们只能自己计数。基本思路是要自己找一个地方,把操作记录表的行数存起来。

2 用缓存系统保存计数

  可以用一个Redis服务来保存这个表的总行数。这个表每被插入一行Redis计数就加1,每被删除一行Redis计数就减1。这种方式下,读和更新操作都很快。

But,缓存系统可能会丢失更新。

  实际上,即使Redis正常工作,这个值还是逻辑上不精确的。

例如:有一个要显示操作记录的总数的页面,同时还要显示最近操作的100条记录。那么,这个页面的逻辑就需要先到Redis里面取出计数,再到数据表里面取数据记录。

不精确体现如下:

  • 查到的100行结果里面有最新插入记录,而Redis的计数里还没加1;
  • 查到的100行结果里没有最新插入的记录,而Redis的计数里已经加了1。

在这里插入图片描述

图2 会话A、B执行时序图

  在T3时刻会话B来查询的时候,会显示出新插入的R这个记录,但是Redis的计数还没加1。   把会话A的更新顺序换一下,都是先操作redis,然后再操作数据。 在这里插入图片描述 图3 调整顺序后,会话A、B的执行时序图

  会话B在T3时刻查询的时候,Redis计数加了1了,但还查不到新插入的R这一行。并发系统无法精确控制不同线程的执行时刻,因为存在图中的这种操作序列,所以,即使Redis正常工作,这个计数值还是逻辑上不精确的。

3 在数据库保存计数

  使用redis的话两个不同的存储构成的系统,不支持分布式事务,无法拿到精确一致的视图

如果把这个计数直接放到数据库里单独的一张计数表C中,会怎么样?

  • 首先解决了崩溃丢失的问题,InnoDB是支持崩溃恢复数据的。
  • 对于计数不精确的问题,可以利用事务的特性来解决这个问题。

在这里插入图片描述

图4 会话A、B的执行时序图

  虽然会话B的读操作仍然是在T3执行的,但是因为这时候更新事务还没有提交,计数值加1这个操作对会话B还不可见。

  会话B看到的结果里, 查计数值和“最近100条记录”看到的结果,逻辑上就是一致的。

4 不同的count用法的性能区别

  count(*)、count(主键id)和count(1) 都表示返回满足条件的结果集的总行数;而count(字段),则表示返回满足条件的数据行里面,参数“字段”不为NULL的总个数。

分析性能差别的时候,有这样几个原则:

  • server层要什么就给什么;
  • InnoDB只给必要的值;
  • 现在的优化器只优化了count(*)的语义为“取行数”。

4.1 count(主键id)

  InnoDB引擎会遍历整张表,把每一行的id值都取出来,返回给server层。server层拿到id后,判断不为空,按行累加。

4.2 count(1)

  InnoDB引擎遍历整张表,但不取值。server层对于返回的每一行,放一个数字“1”进去,判断不为空,按行累加。

  count(1)执行得要比count(主键id)快。因为从引擎返回id会涉及到解析数据行,以及拷贝字段值的操作。

4.3 count(字段)

  • 如果这个“字段”是定义为not null的话,一行行地从记录里面读出这个字段,判断不能为null,按行累加;
  • 如果这个“字段”定义允许为null,那么执行的时候,判断到有可能是null,还要把值取出来再判断一下,不是null才累加。

前面的第一条原则:server层要什么字段,InnoDB就返回什么字段。

4.4 count(*)是例外

  并不会把全部字段取出来,而是专门做了优化,不取值。count(*)肯定不是null,按行累加。

结论:按照效率排序的话,count(字段) < count(主键id) < count(1) ≈ count(*),因此建议尽量使用count(*)。

Guess you like

Origin juejin.im/post/7032845456623271972