文章目录

前言
一、Redis有哪些应用场景？
二、Redis的网络模型是什么样子的
三、Redis是单线程的吗？
四、Redis为什么运行速度那么快？
五、Redis的key过期策略
六、缓存穿透、缓存击穿和缓存雪崩
七、Redis的五种数据类型的底层数据结构
总结

前言

本篇文章主要介绍了Redis在面试中经常会被问到的一些问题，主要包括Redis的应用场景、网络模型以及缓存穿透、缓存击穿和缓存雪崩等相关问题，非常重要。

一、Redis有哪些应用场景？

键的类型只能为字符串，值支持五种数据类型：字符串、散列表、列表、集合、有序集合。

redis以key-value方式存储，支持诸多种数据结构：String，Hash，List，Set，Sorted Set

1.String字符串，应用场景最多的数据结构，其他四种是在此基础上实现的，value可以使简单的字符串、xml、json、数字、二进制。

2.Hash，指的是键值本身也是一种键值对的存储结构，将结构化的信息打包成hashmap，例如key：{ {field1:value1},{field2:value2},{field3:value3},{field4:value4}…}，相比string减少了反序列化和序列化的消耗，也不适用于一些并发修改value中某个value的操作。

应用场景：例如门店/商品/用户信息的管理操作，但是不同于关系型数据库的结构完全结构化，hash的结构是稀疏的，没法做到级联查询。

3.List列表，双端链表实现，可以使用list的一些特性，例如push的方式塞入，pop的方式取出，可以读取某个范围的元素，也可以充当队列使用。有序且可重复。

应用场景：文章、任务列表、消息队列，Redis的list数据结构是一个双向链表，很容易模拟出队列效果，利用Lpush+Rpop。

4.Set无序集合

应用场景：共同好友，在set集合中，有交集并集补集的api，我们可以把两人的关注的人分别放入到一个set集合中，然后再通过api去查看这两个set集合中的交集数据。

5.Sorted Set有序集合

应用场景：点赞排行榜，采用一个可以排序的set集合，就是sortedSet

二、Redis的网络模型是什么样子的

文件描述符（File Descriptor）：简称FD，是一个从0开始的无符号整数，用来关联Linux中的一个文件。在Linux中，一切皆文件，例如常规文件、视频、硬件设备等，当然也包括网络套接字（Socket）。

FD的作用：通过FD，我们的网络模型可以利用一个线程监听多个FD，并在某个FD可读、可写时得到通知，从而避免无效的等待，充分利用CPU资源。

IO多路复用模型：
当用户去读取数据的时候，不再去直接调用recvfrom了，而是调用select的函数，select函数会将需要监听的数据交给内核，由内核去检查这些数据是否就绪了，如果说这个数据就绪了，就会通知应用程序数据就绪，然后来读取数据，再从内核中把数据拷贝给用户态，完成数据处理，如果N多个FD一个都没处理完，此时就进行等待。
在这里插入图片描述
IO多路复用是利用单个线程来同时监听多个FD，并在某个FD可读、可写时得到通知，从而避免无效的等待，充分利用CPU资源。

监听FD的方式、通知的方式又有多种实现，常见的有：select、poll、epoll。

select模式存在的三个问题：

能监听的FD最大不超过1024
每次select都需要把所有要监听的FD都拷贝到内核空间
每次都要遍历所有FD来判断就绪状态

poll模式的问题：

poll利用链表解决了select中监听FD上限的问题，但依然要遍历所有FD，如果监听较多，性能会下降

epoll模式中如何解决这些问题的？

基于epoll实例中的红黑树保存要监听的FD，理论上无上限，而且增删改查效率都非常高
每个FD只需要执行一次epoll_ctl添加到红黑树，以后每次epol_wait无需传递任何参数，无需重复拷贝FD到内核空间
利用ep_poll_callback机制来监听FD状态，无需遍历所有FD，因此性能不会随监听的FD数量增多而下降

基于IO多路复用+事件派发的多线程网络模型
在这里插入图片描述
当我们的客户端想要去连接我们服务器，会去先到IO多路复用模型去进行排队，会有一个连接应答处理器，他会去接收客户端socket，注册客户端FD到多路复用程序。此时这些建立起来的连接，如果客户端请求一条命令时，命令请求处理器会去把数据读取出来（读取IO，读取这条命令），然后把数据放入到client中， clinet去解析当前的命令转化为redis认识的命令，接下来就开始处理这些命令，从redis中的command中找到这些命令，然后就真正的去操作对应的数据了，当数据操作完成后，会去找到命令回复处理器，再由他将数据写出（响应IO，例如你执行了一条set name jim 命令，会响应一个ok）。

三、Redis是单线程的吗？

Redis到底是单线程还是多线程？

如果仅仅聊Redis的核心业务部分（命令处理），答案是单线程
如果是聊整个Redis，那么答案就是多线程，比如网络IO（读取IO和响应IO）和持久化机制中都用到了多线程。

处理一条命令例如set name jim，需要三步1.读取IO流，2计算（也就是数据处理）3.响应io流（就跟数据库一样插入完后响应给用户的信息），

Redis6.0之前，所有的IO写入写出和数据处理都是由单worker线程去做的，如果同时有两个客户端操作，那么就以串行的方式执行

Redis6.0之后，对于IO写入写出会交给IO子线程去处理，核心的计算（就是数据处理）还是由worker单线程去做，用多线程提高了效率。

四、Redis为什么运行速度那么快？

1.Redis是纯内存操作，相对于读写磁盘，redis的执行速度非常快，

2.采用多路 I/O 复用技术可以让单个线程高效的处理多个连接请求，可以同时监听多个FD

3.redis的核心worker线程是单线程的，单线程的原子操作，避免上下文切换的时间和性能消耗。引入多线程会面临线程安全问题，必然要引入线程锁这样的安全手段，实现复杂度增高，而且性能也会大打折扣

4.因为命令是在内存中执行的，非常快，所以限制Redis的更多是网络IO，因此Redis6.x在网络IO这一块引入了多线程，提高了吞吐量。

5.虽然redis的核心worker线程是单线程的，但在很多地方都用了多线程，除了网络IO之外，持久化机制中都用到了多线程。例如Redis的持久化机制，Redis发现RDB的事件可执行时，则调用BGSAVE命令,而BGSAVE命令实际上会fork出一个子进程来进行完成持久化（生成RDB文件）,在fork的过程中，父进程(主线程)肯定是阻塞的,但fork完之后，是fork出来的子进程去完成持久化。

五、Redis的key过期策略

Redis是key-value数据库，我们可以设置Redis中缓存的key的过期时间。Redis的过期策略就是指当 Redis中缓存的key过期了，Redis如何处理。

1.立即删除。在设置键的过期时间时，创建一个回调事件，当过期时间达到时，由时间处理器自动执行键的删除操作。立即删除能保证内存中数据的最大新鲜度，因为它保证过期键值会在过期后马上被删除，其所占用的内存也会随之释放。但是立即删除对 cpu 是最不友好的，因为删除操作会占用 cpu 的时间。

2.惰性删除：某个键值过期后，此键值不会马上被删除，而是等到下次被使用的时候，才会被检查到过期，此时才能得到删除。所以惰性删除的缺点很明显:浪费内存。该策略可以最⼤化地节省CPU资源，却对内存⾮常不友好。极端情况可能出现⼤量的过期key没有再次被访问，从而不会被清除，占用大量内存。

3.定期删除：每隔⼀定的时间，会扫描一定数量的数据库的expires字典中⼀定数量的key，并清除其中已过期的key。该策略是⼀个折中⽅案。通过调整定时扫描的时间间隔和每次扫描的限定耗时，可以在不同情况下使得CPU和内存资源达到最优的平衡效果。

(expires字典会保存所有设置了过期时间的key的过期时间数据，其中，key是指向键空间中的某个键的指针，value是该键的毫秒精度的UNIX时间戳表示的过期时间。键空间是指该Redis集群中保存的所有键。)

Redis中同时使用了惰性过期和定期过期两种过期策略。

六、缓存穿透、缓存击穿和缓存雪崩

缓存中存放的大多都是热点数据，目的就是防止请求可以直接从缓存中获取到数据，而不用访问 Mysql。而这个过程中可能会存在很多问题：

缓存穿透：缓存穿透是指客户端请求的数据在缓存中和数据库中都不存在，这样缓存永远不会生效，这些请求都会打到数据库。（比如黑客故意伪造⼀些乱七八糟的key）

缓存穿透常见的解决方案有两种：
1.缓存空对象：实现简单，维护方便，但会造成额外的内存消耗。
2.使⽤布隆过滤器：它的作⽤就是如果它认为⼀个key不存在，那么这个key就肯定不存在，所以可以在缓存之前加⼀层布隆过滤器来拦截不存在的key

缓存击穿：某⼀个热点key突然失效，也导致了大量请求直接访问Mysql数据库，这就是缓存击穿。

缓存击穿常见的解决方案有两种：

1.互斥锁：因为锁能实现互斥性。假设线程过来，只能一个人一个人的来访问数据库，从而避免对于数据库访问压力过大，但这也会影响查询的性能，因为此时会让查询的性能从并行变成了串行
2.逻辑过期：我们之所以会出现这个缓存击穿问题，主要原因是在于我们对key设置了过期时间，假设我们不设置过期时间，其实就不会有缓存击穿的问题，但是不设置过期时间，数据会一直占用内存，所以可以采用逻辑过期方案。把过期时间设置在 redis的value中，这个过期时间并不会直接作用于redis，而是通过后续逻辑去处理。

逻辑过期重构流程：假设线程1去查询缓存，然后从value中判断出来当前的数据已经过期了，此时线程1去获得互斥锁，那么其他线程会进行阻塞，获得了锁的线程他会开启一个线程去进行以前的重构数据的逻辑，直到新开的线程完成这个逻辑后，才释放锁，而线程1直接进行返回。

缓存雪崩：如果缓存中某⼀时刻⼤批热点数据同时过期，那么就可能导致⼤量请求直接访问mysql了。

解决办法：就是在过期时间上增加⼀点随机值，另外如果搭建⼀个高可用的Redis集群也是防止缓存雪崩的有效手段。

七、Redis的五种数据类型的底层数据结构

RedisObject

Redis中的任意数据类型的键和值都会被封装为一个RedisObject，也叫做Redis对象

什么是RedisObject？
从Redis的使用者的角度来看，⼀个Redis节点包含多个database（非cluster模式下默认是16个，cluster模式下只能是1个），而一个database维护了从key到value的映射关系。这个映射关系的key是string类型，⽽value可以是多种数据类型，比如：string, list, hash、set、sorted set等。我们可以看到，key的类型固定是string，而value可能的类型是多个。

从Redis内部实现的⾓度来看，database内的这个映射关系是用⼀个dict来维护的。dict的key固定用⼀种数据结构来表达就够了，这就是动态字符串sds，而value则比较复杂。为了在同⼀个dict内能够存储不同类型的value，这就需要⼀个通⽤的数据结构，这个通用的数据结构就是redisObject。
在这里插入图片描述

Dict

我们知道Redis是一个键值型（Key-Value Pair）的数据库，我们可以根据键实现快速的增删改查。而键与值的映射关系正是通过Dict来实现的。

Dict由三部分组成，分别是：哈希表（DictHashTable）、哈希节点（DictEntry）、字典（Dict）

Dict的结构：

类似java的HashTable，底层是数组加链表来解决哈希冲突
Dict包含两个哈希表，ht[0]平常用，ht[1]用来rehash

String（简单动态字符串）

String是Redis中最常见的数据存储类型，基于简单动态字符串（SDS）实现。

Redis是C语言实现的，其中简单动态字符串（SDS）是一个结构体，源码如下：

在这里插入图片描述

优点：

1.获取字符串长度的时间复杂度为O（1）
2.支持动态扩容

String在Redis中是⽤⼀个redisObject来表示的，其中ptr指针指向了SDS的地址。用来表示String的redisObject可能编码成3种内部表示：RAW，EMBSTR，INT。

1.其基本编码方式是RAW，如果存储的SDS长度小于44字节，则会采用EMBSTR编码

2.EMBSTR编码，此时redisObject与SDS是一段连续空间。申请内存时只需要调用一次内存分配函数，效率更高。

3.果存储的字符串是整数值，并且大小在LONG_MAX范围内，则会采用INT编码：直接将数据保存在RedisObject的ptr指针位置（刚好8字节），减少内存的使用，不再需要SDS了，

List（QuickList（LinkedList + ZipList））

Redis的List类型可以从首、尾操作列表中的元素。Redis的List结构类似一个双端链表，可以从首、尾操作列表中的元素：

哪一个数据结构能满足上述特征？

LinkedList ：普通链表，可以从双端访问，内存占用较高，内存碎片较多
ZipList ：压缩列表，可以从双端访问，内存占用低，存储上限低
QuickList：LinkedList + ZipList，可以从双端访问，内存占用较低，包含多个ZipList，存储上限高

ZipList 是一种特殊的“双端链表” ，由一系列特殊编码的连续内存块组成。可以在任意一端进行压入/弹出操作, 并且该操作的时间复杂度为 O(1)。

ZipList特性：

1.压缩列表可以看做一种连续内存空间的"双向链表"
2.列表的节点之间不是通过指针连接，而是记录上一节点和本节点长度来寻址，内存占用较低
在这里插入图片描述

QuickList的特点：
1.是一个节点为ZipList的双端链表。
2.节点采用ZipList，解决了传统链表的内存占用问题。
3.控制了ZipList大小，解决连续内存空间申请效率问题。
4.中间节点可以压缩，进一步节省了内存。

在这里插入图片描述

在3.2版本之前，Redis采用ZipList和LinkedList来实现List，当元素数量小于512并且元素大小小于64字节时采用ZipList编码，超过则采用LinkedList编码。

在3.2版本之后，Redis统一采用QuickList来实现List

Set（Dict）

Set是Redis中的单列集合，满足下列特点：
1.不保证有序性。
2.保证元素唯一。
3.求交集、并集、差集。
在这里插入图片描述
所以：Set是Redis中的集合，不一定确保元素有序，可以满足元素唯一、查询效率要求极高。

可以看出，，思考一下，什么样的数据结构可以满足？
HashTable，也就是Redis中的Dict，不过Dict是双列集合（可以存键、值对），为了查询效率和唯一性，set采用HT编码（Dict）。Dict中的key用来存储元素，value统一为null。

当存储的所有数据都是整数，并且元素数量不超过set-max-intset-entries时，Set会采用IntSet编码，以节省内存。
在这里插入图片描述

ZSet（SkipList+Dict）

ZSet也就是SortedSet，其中每一个元素都需要指定一个score值和member值：
1.可以根据score值排序后。
2.member必须唯一。
3.可以根据member查询分数。
在这里插入图片描述
因此，zset底层数据结构必须满足键值存储、键必须唯一、可排序这几个需求。之前学习的哪种编码结构可以满足？

SkipList：可以排序，并且可以同时存储score和ele值（member）
Dict：可以键值存储，并且可以根据key找value

SkipList（跳表）首先是链表，但与传统链表相比有几点差异：

1.元素按照升序排列存储。
2.节点可能包含多个指针，指针跨度不同。
在这里插入图片描述
zset底层数据结构:

当元素数量不多时，HT和SkipList的优势不明显，而且更耗内存。因此zset还会采用ZipList结构来节省内存，不过需要同时满足两个条件：

元素数量小于zset_max_ziplist_entries，默认值128
每个元素都小于zset_max_ziplist_value字节，默认值64

Hash（ZipList或者Dict）

Hash结构与Redis中的Zset非常类似：

都是键值存储
都需求根据键获取值
键必须唯一

区别如下：

zset的键是member，值是score；hash的键和值都是任意值
zset要根据score排序；hash则无需排序

Hash结构默认采用ZipList编码，用以节省内存。 ZipList中相邻的两个entry 分别保存field和value

当数据量较大时，Hash结构会转为HT编码，也就是Dict

在这里插入图片描述

总结

本篇文章内容较多，但都是Redis最基础也是非常重要的知识点，在面试中被问到的频率也非常高，在后面的文章中将会介绍更多有关Redis的内容，供读者参考学习。

Redis面试连环问，你能撑到哪一问

文章目录

前言

一、Redis有哪些应用场景？

二、Redis的网络模型是什么样子的

三、Redis是单线程的吗？

四、Redis为什么运行速度那么快？

五、Redis的key过期策略

六、缓存穿透、缓存击穿和缓存雪崩

七、Redis的五种数据类型的底层数据结构

RedisObject

Dict

String（简单动态字符串）

List（QuickList（LinkedList + ZipList））

Set（Dict）

ZSet（SkipList+Dict）

Hash（ZipList或者Dict）

总结

猜你喜欢