Redis 知识点总结(持续更新中)

1.概述

1.1、什么是Redis

Redis是一个完全开源免费的,遵循BSD协议的高性能Key-Value类型的额内存数据库。因为是纯内存操作,Redis 的性能非常出色,每秒可以处理超过10万次的读写操作,是已是最快的Key-Value类型的Key-Value数据库。而且Redis是一个NOSQL类型数据库,是为了解决高并发、高扩展,大数据存储等一系列问题而产生的数据库解决方案,是一个非关系型的数据库。但是它无法替代关系型数据库,只能作为特定环境下的扩充。

1.2.Redis的优点和缺点

优点

  • redis数据读写速度非常快,因为它把数据都读取到内存中操作,而且Redis使用C语言编写的,是最接近操作系统的语言,所以执行速度快。

  • redis虽然数据都存在内存中,但最终还支持数据持久化到硬盘当中。

  • redis提供了丰富的数据结构

  • redis所有操作都具有原子性,支持事务,所谓原子性就是对数据的更改要么全执行,要么全部不执行。

  • redis支持主从复制,主机会自动同步数据到从机,可以进行读写分离。
    缺点

  • 由于是内存数据库,所以,单台机器,存储的数据量,跟机器本身的内存大小。虽然redis本身有key过期策略,但是还是需要提前预估和节约内存。如果内存增长过快,需要定期删除数据。

  • 如果进行完整重同步,由于需要生成rdb文件,并进行传输,会占用主机的CPU,并会消耗现网的带宽。不过redis2.8版本,已经有部分重同步的功能,但是还是有可能有完整重同步的。比如,新上线的备机。

  • 修改配置文件,进行重启,将硬盘中的数据加载进内存,时间比较久。在这个过程中,redis不能提供服务。

1.3.Redis和memcached相比,有哪些优势

首先介绍一下memcached,Memcached 是一个高性能的分布式内存对象缓存系统,用于动态Web应用以减轻数据库负载。它通过在内存中缓存数据和对象来减少读取数据库的次数,从而提高动态、数据库驱动网站的速度。Memcached基于一个存储键/值对的hashmap。其守护进程(daemon )是用C写的,但是客户端可以用任何语言来编写,并通过memcached协议与守护进程通信。
二者区别在于

  1. Redis 做缓存可以持久化,memcached做缓存,数据容易丢失。
  2. Resis 可以存放多种数据类型(string、list、set、hash、Sorted),而memcached只能存储字符串。
  3. Redis 服务器仅支持单进程单线层的访问,也就是后来先来后到的串行模式,避免线程上下文切换,自然保证了数据操作的原子性,Memcached服务端是支持多线程访问的。
  4. Redis虽然是单进单线程的模式,但是redis使用的IO多路复用技术保证了同一个线程能够处理多个请求。
  5. Redis 的速度比memcached快很多。
  6. Redis的单个Value最大限制为1GB,而memcached最大限制为1MB。

1.5.为什么Redis 是单线程的

因为Redis是基于内存的操作,CPU不是Redis的瓶颈,Redis的瓶颈最有可能就是机器内存的大小或者网络带宽。既然单线程容易实现,而且CPU还不会成为瓶颈,所以当然要用单线程方案了,毕竟多线程方案会带来许多的麻烦。
而且Redis使用的是多路I/O复用模型,非阻塞IO。
多路IO复用模型是利用select,poll,epoll来监察多个流的I/O事件的能力,在空闲时,会把当前进程阻塞掉,当有一个或多个流有I/O事件时,就从阻塞态中唤醒,于是程序就会轮询一遍所有的流(epoll是值轮询那些真正发出事件的流),并且只依次顺序处理就绪的流,从而避免了大量无用工作。
多路指的是多个网络连接,而复用指的是复用同一个线程。Redis采用多路I/O复用技术可以让单个线程高效的处理多个连接请求(尽量减少网络连接消耗)。

1.6.Redis和Redisson有什么关系

Redis是一个高级的分布式协调Redis客服端,能帮助用户在分布式环境下轻松实现一些Java的对象。(Bloom filter, BitSet, Set, SetMultimap, ScoredSortedSet, SortedSet, Map, ConcurrentMap, List, ListMultimap, Queue, BlockingQueue, Deque, BlockingDeque, Semaphore, Lock, ReadWriteLock, AtomicLong, CountDownLatch, Publish / Subscribe, HyperLogLog)。

2.数据类型

2.1 Redis 支持哪几种数据类型

StringListSetHashSorted Set

2.1 Redis有哪些适合的场景?

(1)会话缓存(Session Cache)
最常用的一种使用Redis的情景是会话缓存(session cache)。用Redis缓存会话比其他存储(如Memcached)的优势在于:Redis提供持久化。当维护一个不是严格要求一致性的缓存时,如果用户的购物车信息全部丢失,大部分人都会不高兴的,现在,他们还会这样吗?
幸运的是,随着 Redis 这些年的改进,很容易找到怎么恰当的使用Redis来缓存会话的文档。甚至广为人知的商业平台Magento也提供Redis的插件。
(2)全页缓存(FPC)
除基本的会话token之外,Redis还提供很简便的FPC平台。回到一致性问题,即使重启了Redis实例,因为有磁盘的持久化,用户也不会看到页面加载速度的下降,这是一个极大改进,类似PHP本地FPC。
再次以Magento为例,Magento提供一个插件来使用Redis作为全页缓存后端。
此外,对WordPress的用户来说,Pantheon有一个非常好的插件 wp-redis,这个插件能帮助你以最快速度加载你曾浏览过的页面。
(3)队列
Reids在内存存储引擎领域的一大优点是提供 list 和 set 操作,这使得Redis能作为一个很好的消息队列平台来使用。Redis作为队列使用的操作,就类似于本地程序语言(如Python)对 list 的 push/pop 操作。
如果你快速的在Google中搜索“Redis queues”,你马上就能找到大量的开源项目,这些项目的目的就是利用Redis创建非常好的后端工具,以满足各种队列需求。例如,Celery有一个后台就是使用Redis作为broker,你可以从这里去查看。
(4)排行榜/计数器
Redis在内存中对数字进行递增或递减的操作实现的非常好。集合(Set)和有序集合(Sorted Set)也使得我们在执行这些操作的时候变的非常简单,Redis只是正好提供了这两种数据结构。所以,我们要从排序集合中获取到排名最靠前的10个用户–我们称之为“user_scores”,我们只需要像下面一样执行即可:
当然,这是假定你是根据你用户的分数做递增的排序。如果你想返回用户及用户的分数,你需要这样执行:
ZRANGE user_scores 0 10 WITHSCORES
Agora Games就是一个很好的例子,用Ruby实现的,它的排行榜就是使用Redis来存储数据的,你可以在这里看到。
(5)发布/订阅
最后(但肯定不是最不重要的)是Redis的发布/订阅功能。发布/订阅的使用场景确实非常多。我已看见人们在社交网络连接中使用,还可作为基于发布/订阅的脚本触发器,甚至用Redis的发布/订阅功能来建立聊天系统!

3.持久化

3.1 什么是Redis持久化?

用一句话概括持久化,就是把数据(内存中的对象)保存到可以永久保存的存储设备中。
Redis提供了两种持久化方式:
RDB持久化方式:能够在指定的时间间隔对你的数据库进行快照存储到硬盘上。

AOF持久化方式:以日志的形式记录每次对服务器写的操作,当服务器重启的时候会重新执行这些命令来恢复原始的数据状态。但当Redis进程或停电等问题可能会造成几分钟的写入丢失。

3.2 如何选择合适的持久化方式

一般来说,如果想达到足以媲美PostgreSQL的数据安全性,你应该同时使用两种持久化功能。如果你非常关心你的数据,但仍然可以承受数分钟之内的数据丢失,那么你可以只使用RDB持久化。
许多用户都只使用AOF持久化,但并不推荐这种方式:因为定时生成RDB快照(shapshot)非常便于进行数据库备份,并且RDB恢复数据集的速度页要比AOF恢复的速度要快,除此之外,使用RDB还可以避免之前提到的AOF程序的bug。

4.缓存异常

4.1 缓存穿透

**定义:**缓存穿透是指查询一个一定不存在的数据,由于缓存是不命中,将去查询数据库,但是数据库也无此记录,并且处于容错考虑,我们没有将这次查询的null写入缓存,这将导致这个不存在的数据每次请求都要到存储层去查询,失去了缓存的意义。在流量大时,可能DB就挂掉了,要是有人利用不存在的key频繁攻击我们的应用,造成安全问题。

解决办法:

  • 方法1:使用布隆过滤器,把所有的数据存到一个足够大的bitmap中,一个一定不存在的数据会被 这个bitmap拦截掉,从而避免了对底层存储系统的查询压力。
  • 方法2:如果一个查询返回的数据为空(不管是数据不存在,还是系统故障),我们仍然把这个空结果进行缓存,但它的过期时间会很短,最长不超过五分钟。

4.2 缓存击穿

**定义:**对于一些设置了过期时间的key,如果这些key可能会在某些时间点被超高并发地访问,是一种非常“热点”的数据。这个时候,需要考虑一个问题:如果这个key在大量请求同时进来前正好失效,那么所有对这个key的数据查询都落到db,我们称为缓存击穿。
和缓存雪崩的区别:

缓存击穿是这样的:
在这里插入图片描述
缓存雪崩是这样的:
在这里插入图片描述
解决办法:

  • 方法1:使用互斥锁排队,一种非常普遍的做法,当key获取的value值为空时,加锁;从数据库中读出数据后,再把锁释放。若其它线程获取锁失败,则等待一段时间后重试。
  • 方法2:接口限流与熔断、降级。对重要接口及性能限流,防止被恶意刷接口,同时要降级准备,当接口中的某些服务不可用时候,进行熔断,失败快速返回机制。
  • 方法3:使用布隆过滤器,首先判断key是否存在,不存在直接返回。

4.3 缓存雪崩

**定义:**当缓存服务器重启或者大量缓存集中在某一个时间段失效时,这样在失效的情况下,会给DB造成很大的压力。具体来说,就是大量的key集体发生了缓存击穿,就是造成了缓存雪崩。
解决方法:

  • 方法1:和穿透一样,使用分布式锁,对key进行加锁。
  • 方案2:搭设redis集群,一台罢工后,其它的还可以继续工作。
    **方案3:**给缓存的失效时间,加上一个随机值,避免集体失效。
发布了34 篇原创文章 · 获赞 79 · 访问量 1万+

猜你喜欢

转载自blog.csdn.net/qq_36008321/article/details/104780831