文章目录

1.概述

1.1、什么是Redis
1.2.Redis的优点和缺点
1.3.Redis和memcached相比，有哪些优势
1.5.为什么Redis 是单线程的
1.6.Redis和Redisson有什么关系

2.数据类型

2.1 Redis 支持哪几种数据类型
2.1 Redis有哪些适合的场景？

3.持久化

3.1 什么是Redis持久化？
3.2 如何选择合适的持久化方式

4.缓存异常

4.1 缓存穿透
4.2 缓存击穿
4.3 缓存雪崩

1.概述

1.1、什么是Redis

Redis是一个完全开源免费的，遵循BSD协议的高性能Key-Value类型的额内存数据库。因为是纯内存操作，Redis 的性能非常出色，每秒可以处理超过10万次的读写操作，是已是最快的Key-Value类型的Key-Value数据库。而且Redis是一个NOSQL类型数据库，是为了解决高并发、高扩展，大数据存储等一系列问题而产生的数据库解决方案，是一个非关系型的数据库。但是它无法替代关系型数据库，只能作为特定环境下的扩充。

1.2.Redis的优点和缺点

优点

redis数据读写速度非常快，因为它把数据都读取到内存中操作，而且Redis使用C语言编写的，是最接近操作系统的语言，所以执行速度快。
redis虽然数据都存在内存中，但最终还支持数据持久化到硬盘当中。
redis提供了丰富的数据结构
redis所有操作都具有原子性，支持事务，所谓原子性就是对数据的更改要么全执行，要么全部不执行。
redis支持主从复制，主机会自动同步数据到从机，可以进行读写分离。
缺点
由于是内存数据库，所以，单台机器，存储的数据量，跟机器本身的内存大小。虽然redis本身有key过期策略，但是还是需要提前预估和节约内存。如果内存增长过快，需要定期删除数据。
如果进行完整重同步，由于需要生成rdb文件，并进行传输，会占用主机的CPU，并会消耗现网的带宽。不过redis2.8版本，已经有部分重同步的功能，但是还是有可能有完整重同步的。比如，新上线的备机。
修改配置文件，进行重启，将硬盘中的数据加载进内存，时间比较久。在这个过程中，redis不能提供服务。

1.3.Redis和memcached相比，有哪些优势

首先介绍一下memcached，Memcached 是一个高性能的分布式内存对象缓存系统，用于动态Web应用以减轻数据库负载。它通过在内存中缓存数据和对象来减少读取数据库的次数，从而提高动态、数据库驱动网站的速度。Memcached基于一个存储键/值对的hashmap。其守护进程（daemon ）是用C写的，但是客户端可以用任何语言来编写，并通过memcached协议与守护进程通信。
二者区别在于：

Redis 做缓存可以持久化，memcached做缓存，数据容易丢失。
Resis 可以存放多种数据类型（string、list、set、hash、Sorted），而memcached只能存储字符串。
Redis 服务器仅支持单进程单线层的访问，也就是后来先来后到的串行模式，避免线程上下文切换，自然保证了数据操作的原子性，Memcached服务端是支持多线程访问的。
Redis虽然是单进单线程的模式，但是redis使用的IO多路复用技术保证了同一个线程能够处理多个请求。
Redis 的速度比memcached快很多。
Redis的单个Value最大限制为1GB，而memcached最大限制为1MB。

1.5.为什么Redis 是单线程的

因为Redis是基于内存的操作，CPU不是Redis的瓶颈，Redis的瓶颈最有可能就是机器内存的大小或者网络带宽。既然单线程容易实现，而且CPU还不会成为瓶颈，所以当然要用单线程方案了，毕竟多线程方案会带来许多的麻烦。
而且Redis使用的是多路I/O复用模型，非阻塞IO。
多路IO复用模型是利用select,poll,epoll来监察多个流的I/O事件的能力，在空闲时，会把当前进程阻塞掉，当有一个或多个流有I/O事件时，就从阻塞态中唤醒，于是程序就会轮询一遍所有的流（epoll是值轮询那些真正发出事件的流），并且只依次顺序处理就绪的流，从而避免了大量无用工作。
多路指的是多个网络连接，而复用指的是复用同一个线程。Redis采用多路I/O复用技术可以让单个线程高效的处理多个连接请求（尽量减少网络连接消耗）。

1.6.Redis和Redisson有什么关系

Redis是一个高级的分布式协调Redis客服端，能帮助用户在分布式环境下轻松实现一些Java的对象。(Bloom filter, BitSet, Set, SetMultimap, ScoredSortedSet, SortedSet, Map, ConcurrentMap, List, ListMultimap, Queue, BlockingQueue, Deque, BlockingDeque, Semaphore, Lock, ReadWriteLock, AtomicLong, CountDownLatch, Publish / Subscribe, HyperLogLog)。

2.数据类型

2.1 Redis 支持哪几种数据类型

String、List、Set、Hash、Sorted Set

2.1 Redis有哪些适合的场景？

（1）会话缓存（Session Cache）
最常用的一种使用Redis的情景是会话缓存（session cache）。用Redis缓存会话比其他存储（如Memcached）的优势在于：Redis提供持久化。当维护一个不是严格要求一致性的缓存时，如果用户的购物车信息全部丢失，大部分人都会不高兴的，现在，他们还会这样吗？
幸运的是，随着 Redis 这些年的改进，很容易找到怎么恰当的使用Redis来缓存会话的文档。甚至广为人知的商业平台Magento也提供Redis的插件。
（2）全页缓存（FPC）
除基本的会话token之外，Redis还提供很简便的FPC平台。回到一致性问题，即使重启了Redis实例，因为有磁盘的持久化，用户也不会看到页面加载速度的下降，这是一个极大改进，类似PHP本地FPC。
再次以Magento为例，Magento提供一个插件来使用Redis作为全页缓存后端。
此外，对WordPress的用户来说，Pantheon有一个非常好的插件 wp-redis，这个插件能帮助你以最快速度加载你曾浏览过的页面。
（3）队列
Reids在内存存储引擎领域的一大优点是提供 list 和 set 操作，这使得Redis能作为一个很好的消息队列平台来使用。Redis作为队列使用的操作，就类似于本地程序语言（如Python）对 list 的 push/pop 操作。
如果你快速的在Google中搜索“Redis queues”，你马上就能找到大量的开源项目，这些项目的目的就是利用Redis创建非常好的后端工具，以满足各种队列需求。例如，Celery有一个后台就是使用Redis作为broker，你可以从这里去查看。
（4）排行榜/计数器
Redis在内存中对数字进行递增或递减的操作实现的非常好。集合（Set）和有序集合（Sorted Set）也使得我们在执行这些操作的时候变的非常简单，Redis只是正好提供了这两种数据结构。所以，我们要从排序集合中获取到排名最靠前的10个用户–我们称之为“user_scores”，我们只需要像下面一样执行即可：
当然，这是假定你是根据你用户的分数做递增的排序。如果你想返回用户及用户的分数，你需要这样执行：
ZRANGE user_scores 0 10 WITHSCORES
Agora Games就是一个很好的例子，用Ruby实现的，它的排行榜就是使用Redis来存储数据的，你可以在这里看到。
（5）发布/订阅
最后（但肯定不是最不重要的）是Redis的发布/订阅功能。发布/订阅的使用场景确实非常多。我已看见人们在社交网络连接中使用，还可作为基于发布/订阅的脚本触发器，甚至用Redis的发布/订阅功能来建立聊天系统！

3.持久化

3.1 什么是Redis持久化？

用一句话概括持久化，就是把数据（内存中的对象）保存到可以永久保存的存储设备中。
Redis提供了两种持久化方式：
RDB持久化方式：能够在指定的时间间隔对你的数据库进行快照存储到硬盘上。

AOF持久化方式：以日志的形式记录每次对服务器写的操作，当服务器重启的时候会重新执行这些命令来恢复原始的数据状态。但当Redis进程或停电等问题可能会造成几分钟的写入丢失。

3.2 如何选择合适的持久化方式

一般来说，如果想达到足以媲美PostgreSQL的数据安全性，你应该同时使用两种持久化功能。如果你非常关心你的数据，但仍然可以承受数分钟之内的数据丢失，那么你可以只使用RDB持久化。
许多用户都只使用AOF持久化，但并不推荐这种方式：因为定时生成RDB快照（shapshot）非常便于进行数据库备份，并且RDB恢复数据集的速度页要比AOF恢复的速度要快，除此之外，使用RDB还可以避免之前提到的AOF程序的bug。

4.缓存异常

4.1 缓存穿透

**定义：**缓存穿透是指查询一个一定不存在的数据，由于缓存是不命中，将去查询数据库，但是数据库也无此记录，并且处于容错考虑，我们没有将这次查询的null写入缓存，这将导致这个不存在的数据每次请求都要到存储层去查询，失去了缓存的意义。在流量大时，可能DB就挂掉了，要是有人利用不存在的key频繁攻击我们的应用，造成安全问题。

解决办法：

方法1：使用布隆过滤器，把所有的数据存到一个足够大的bitmap中，一个一定不存在的数据会被这个bitmap拦截掉，从而避免了对底层存储系统的查询压力。
方法2：如果一个查询返回的数据为空（不管是数据不存在，还是系统故障），我们仍然把这个空结果进行缓存，但它的过期时间会很短，最长不超过五分钟。

4.2 缓存击穿

**定义：**对于一些设置了过期时间的key，如果这些key可能会在某些时间点被超高并发地访问，是一种非常“热点”的数据。这个时候，需要考虑一个问题：如果这个key在大量请求同时进来前正好失效，那么所有对这个key的数据查询都落到db，我们称为缓存击穿。
和缓存雪崩的区别：

缓存击穿是这样的：
在这里插入图片描述
缓存雪崩是这样的：

解决办法：

方法1：使用互斥锁排队，一种非常普遍的做法，当key获取的value值为空时，加锁；从数据库中读出数据后，再把锁释放。若其它线程获取锁失败，则等待一段时间后重试。
方法2：接口限流与熔断、降级。对重要接口及性能限流，防止被恶意刷接口，同时要降级准备，当接口中的某些服务不可用时候，进行熔断，失败快速返回机制。
方法3：使用布隆过滤器，首先判断key是否存在，不存在直接返回。

4.3 缓存雪崩

**定义：**当缓存服务器重启或者大量缓存集中在某一个时间段失效时，这样在失效的情况下，会给DB造成很大的压力。具体来说，就是大量的key集体发生了缓存击穿，就是造成了缓存雪崩。
解决方法：

方法1：和穿透一样，使用分布式锁，对key进行加锁。
方案2：搭设redis集群，一台罢工后，其它的还可以继续工作。
**方案3：**给缓存的失效时间，加上一个随机值，避免集体失效。

L_P_

发布了34 篇原创文章 · 获赞 79 · 访问量 1万+

私信关注

Redis 知识点总结（持续更新中）