保证数据库与缓存一致性的几种策略

分布式系统下，数据库和缓存本来就无法保证强一致性，因为数据库+缓存的操作并不是原子操作，所以在服务过程中，我们可以忍受一段时间内的数据不一致，但是一定要保证最终一致性。

而一般来说，有三种更新策略：

先更新缓存，再更新数据库

这绝对不是个好方法，考虑这么一种情况：

当更新缓存成功，而更新数据库失败时，就直接造成了数据不一致。所以说这种策略几乎没啥人会使用

这也不是个好办法，考虑这么一种情况：

1.线程1将数据库更新为A，线程2将数据库更新B

2.线程2将缓存更新为B，线程1将缓存更新为A

那么这会造成不一致：数据库中，B把A覆盖了（这是正确的逻辑），但是在缓存中，A把B覆盖了。就会造成数据不一致了。造成这个问题的罪魁祸首就是整个操作是非原子性的，有线程安全问题。

再考虑这么一种情况：如果在一个读多写少的场景，数据的更新非常频繁(包括数据库中和缓存中)，有可能缓存中的数据被频繁更新，但是有一些数据压根就从来没有被访问过，然后又被新值覆盖了，这样就会造成浪费。

这是一种比较常用的方法。如果淘汰缓存成功，而更新数据库失败，这只会稍微降低缓存的缓存的命中率。相比于不一致性，这是可以接受了。

当然这个方法也无法完全保证一致性，考虑这样一种情况：当缓存淘汰之后，开始执行数据库更新工作，但是这个操作还没做完，就有另一个读请求落在了数据库上，读到了旧值，并把旧值放进了缓存中，那么就会出现缓存数据库不一致了。

上面的情况是在单机情况下，在读写分离，也就是拥有主从服务器的架构中，这种情况更明显：淘汰了缓存，主服务器完成更新，但是主从同步还未完成，在这期间，读请求落在了从服务器上，由于主从同步还未完成，就会读到旧值，并且放到了缓存中，也就造成了数据不一致

解决方法：

简单暴力，使用分布式锁，将读写串行化，但是这样会大幅度地降低吞吐量
采用延时双删策略：实现也很简单，就是淘汰完缓存，然后更新数据库之后，休眠一段时间，然后再去删除缓存中的值。这样就可以删除缓存中不一致的数据。当然直接休眠一段时间会降低吞吐量，可以启动一个线程，异步地完成这个操作

如果更新数据库失败，则直接返回，不会有任何影响；若更新数据库成功，淘汰缓存失败，此时会直接造成数据不一致。当然，及时全部操作成功，也会造成数据不一致，比如：

线程1查询一个旧值，然后线程2更新数据为新值，然后把缓存删除，线程1才姗姗来迟地把缓存更新为旧值。这样就造成数据不一致。

解决方法：同样使用延时双删策略

Jayicee

发布了60 篇原创文章 · 获赞 7 · 访问量 3873

私信关注