1. 概述及基本操作
1.1 问题的抛出
出现的问题:
- 海量用户
- 高并发
罪魁祸首——关系型数据库:
- 性能瓶颈:磁盘IO性能低下
- 扩展瓶颈:数据关系复杂,扩展性差,不便于大规模集群
解决思路:
- 降低磁盘IO次数,越低越好 —— 内存存储
- 去除数据间的关系,越简单越好 —— 不存储关系,仅存储数据
1.2 Nosql简介
NoSQL:
即Not-OnlySQL(泛指非关系型的数据库),作为关系型数据库的补充。
特征:
- 可扩容,可伸缩
- 大数据量下得高性能
- 灵活得数据模型
- 高可用
常见Nosql数据库:
- Redis
- memcache
- HBase
- MongoDB
解决方案 :
1.3 Redis 简介
1.3.1 介绍
Redis(REmote DIctinary Server)是用C语言开发的一个开源的高性能键值对(key-value)数据库。
特征:
- 数据间没有必然的关联关系
- 内部采用单线程机制进行工作
- 高性能。官方提供测试数据,50个并发执行100000个请求,读的速度是110000次/s,写的速度是81000次/s。
- 多数据类型支持:string(字符串类型)、list(列表类型)、hash(散列类型)、set(集合类型)、sorted_set(有序集合类型)
- 持久化支持。可以进行数据灾难恢复
1.3.2 Redis的应用
- 为热点数据加速查询(主要场景)、如热点商品、热点新闻、热点资讯、推广类等提高访问量信息等。
- 任务队列、如秒杀、抢购、购票等
- 即时信息查询,如各位排行榜、各类网站访问统计、公交到站信息、在线人数信息(聊天室、网站)、设备信号等
- 时效性信息控制,如验证码控制,投票控制等
- 分布式数据共享,如分布式集群构架中的session分离
- 消息队列
- 分布式锁
1.3.1 Redis下载与安装
2. 常见数据类型
2.1 String
2.1.1 基本操作
- 添加/修改数据
set key value
- 获取数据
get key
- 删除数据
del key
- 添加/修改多个数据
mset key1 value1 key2 value2 …
- 获取多个数据
mget key1 key2 …
- 获取数据字符个数(字符串长度)
strlen key
- 追加信息到原始信息后部(如果原始信息存在就追加,否则新建)
append key value
2.1.2 String类型的数值操作
业务场景
-
大型企业级应用中,分表操作是基本操作,使用多张表存储同类型数据,但是对应的主键id必须保证统一性,不能重复。Oracle数据库具有sequence设定,可以解决该问题,但是MySQL数据库并不具有类似的机制,那么如何解决?
-
电商系统中高并发怎么确保生成不重复的商品编号或者订单编号?
解决方案
- 数据自增【值是数字的字符串,该操作是原子性的】
# key的value值加1
incr key
# key的value值加increment,increment只能是整数
incrby key increment
# key的value值加increment,increment可以是小数
incrbyfloat key increment
- 数据自减【值是数字的字符串,该操作是原子性的】
# key的value值减1
decr key
# key的value值减increment,increment只能是整数
decrby key increment
String作为数值操作
- string在redis内部存储默认就是一个字符串,当遇到增减类操作incr,decr时会转成数值型进行计算。
- redis所有的操作都是原子性的,采用单线程处理所有业务,命令是一个一个执行的,因此无需考虑并发带来的数据影响。
- 按数值进行操作的数据,如果原始数据不能转成数值,或超过了redis数值上线范围,将会报错。(最大值是java中long型数据最大值,Long.MAX_VALUE)。
2.1.3 String类型的时效性操作
业务场景
-
“最强女生”,启动海选投票,只能通过微信投票,每个微信号每4个小时只能投1票。
-
电商商家开启热门商品推荐,热门商品不能一直处于热门期,每种商品热门期维持3天,3天后自动取消热门
-
新闻网站会出现热点新闻,热点新闻最大的特征是对时效性,如何自动控制热点新闻的时效性
解决方案
设置数据具有指定的声明周期
setex key seconds value #单位秒
psetex key milliseconds value #单位毫秒
注意:通过setex 或 psetex设置具有时效性的数据后,如果通过set设置同样的key那么原数据会被覆盖,同时过期时间也会失效。
2.1.4 key命名约定
来自与表中的数据,建议使用以下命名规范
表名:主键名:主键值:字段名
2.2 Hash
2.2.1 概述
如果存储的数据是频繁操作的对象类型,那么使用String类型就会显得很笨重。每次修改,即使是只修改一个属性,也需要取出整个对象的所有属性,修改后再全部保存进去,对IO的操作也是比较大的。
比如存储的是购物车对象,我只需要修改一下商品数量字段,最好的办法是我只取出这一个字段操作,String类型显然是做不到的,而Hash类型却可以做到。
- 需要的内存结构:一个存储空间保存多少个键值对数据
- 底层使用哈希表结构实现数据存储
2.2.2 基本操作
- 添加/修改数据
hset key field value
- 获取数据
hget key field
hgetall key
- 删除数据
hdel key field1 [field2]
- 添加/修改多个数据
hmset key field1 value1 field2 calue2
- 获取多个数据
hmget key field1 field2 …
- 获取哈希表中字段的数量
hlen key
- 获取哈希表中是否存在指定的字段
hexists key field
2.2.3 hash类型数据扩展操作
- 获取哈希表中所有的字段名和字段值
hkeys key
hvals key
- 设置指定字段的数值数据增加指定范围的值
hincrby key field increment
hincrbyfloat key field increment
2.2.4 hash类型数据操作的注意事项
- hash类型下的value只能存储字符串,不允许存储其他类型数据,不存在嵌套现象。如果数据未获取到,对应的值为(nil)
- 每个hash可以存储232-1个键值对
- hash类型十分贴近对象的数据存储形式,并且可以灵活添加删除对象属性。但hash设计初中不是为了存储大量对象而设计的,切记不可滥用,更不可以将hash作为对象列表使用
- hgetall操作可以获取全部属性,如果内部fiekd过多,遍历整体数据效率就会很低,有可能成为数据访问瓶颈
2.2.5 hash类型应用场景-购物车
当前设计是否加速了购物车的呈现
当前仅仅是将数据存储到redis中,并没有起到加速的所用,商品信息还需要二次查询数据库。
每条购物车中的商品记录保存成两条field
-
field1 专用于保存购买数量
1、命名格式:商品id:nums
2、保存数据:数值 -
field2 专用于保存购物车中显示的信息,包含文字描述,图片地址,所属商家信息灯还
1、命名格式:商品id:info
2、保存数据:json
优化后的涉及方案还有个问题,就是多个用户的购物车都有同一款商品时,redis中会有大量的重复商品信息。因此我们可以把field2的内容变成一个固定的hash独立出来。添加购物车的时候使用以下语句,保证同一个key下不会存在重复的数据。
hsetnx key field value
2.3 List
- 数据存储需求:存储多个数据,并对数据进入存储空间的顺序进行区分。
- 需要的存储数据:一个存储空间保存多个数据,且通过数据可以体现进入顺序。
- list类型:保存多个数据,底层使用双向链表存储结构实现。
2.3.1 基本操作
- 添加/修改数据
lpush key value1 [value2] …
rpush key value1 [value2] …
- 获取数据
lrange key start stop #查询所有数据lrange key 0 -1
lindex key index
llen key
- 删除并移除数据
lpop key
rpop key
2.3.2 list 类型数组扩展操作
- 在规定的时间内获取数据并移除
blpop key1 [key2] timeout
brpop key1 [key2] timeout
前面的b代表阻塞,意思就是在规定的时间内获取数据并移除,如果没数据会一直等到时间结束,如果等待过程中有数据了,会立马获取并移除。
- 移除指定数据
lrem key count value
2.3.3 list类型数据操作注意事项
- list 中保存的数据都是string类型的,数据总容量是有限的,最多232-1个元素(4294967295)
- list具有索引的概念,但是操作数据时候通常以队列的形式进行入队出队操作,或以栈的形式进入栈出栈的操作
- 获取全部数据操作结束索引设置为-1
- list 可以对数据进行分页操作,通常第一页的信息来自list,第2页及更多的信息通过数据库的形式加载
2.3.4 list类型应用场景
业务场景
微信朋友圈点赞,要求按照点赞顺序显示点赞好友信息,如果取消点赞,移除对应好友信息
取消点赞可以使用下面的命令,移除指定的数据:
lrem key count value
其他业务场景
- twitter、新浪微博、腾讯微博中个人用于的关注列表需要按照用户的关注顺序进行展示,粉丝列表需要将最近关注的粉丝列在前面
- 新闻、资讯类网站如何将最新的新闻或资讯按照发生的时间顺序展示
- 企业运营过程中,系统将产生出大量的运营数据,如何保障多台服务器操作日志的统一顺序输出?
2.4 Set
- 新的存储需求:存储大量的数据,在查询方面提供更高的效率
- 需要的存储结构:能够保存大量的数据,高效的内部存储机制,便于查询
- set类型:无序集合,不允许有重复的值,底层数据结构是值为null的hash表。
2.4.1 基本操作
- 添加数据
sadd key menber1 [member2]
- 获取全部数据
smembers key
- 删除数据
srem key member1 [member2]
- 获取集合数据总量
scard key
- 判断集合中是否包含指定数据
sismember key member
2.4.2 set类型数据的扩展操作
业务场景
每位用户首次使用今日头条时候会设置3项爱好的内容,但是后期为了增加用户的活跃度,兴趣点,必须让用户对其他信息类别逐渐产生兴趣,增加客户留存度,如何实现?
业务分析
- 系统分析出各个分类的最新或最热点信息条目并组织成set集合
- 随机挑选其中部分信息
- 配合用户关注信息分类中的热点信息组织展示的全信息集合
解决方案
- 随机获取集合中指定数量的数据
srandmember key [count]
- 随机获取集合中的某个数据并将该数据移出集合
spop key
Tips8:
- redis应用于随机推荐类信息检索,例如热点歌单推荐,热点新闻推荐,热点旅游线路,应用APP推荐,大V推荐等
2.4.3 set类型应用场景
解决方案
- 求两个集合的交、并、差集
sinter key1 [key2]
sunion key1 [key2]
sdiff key1 [key2]
- 求两个集合的交、并、差集并存储到指定集合中
sinterstore destination key1 [key2]
sunionstore destination key1 [key2]
sdiffstore destination key1 [key2]
- 将指定数据从原始集合移动到目标集合中
smove source destination member
2.4.4 set类型应用场景
解决方案
- 利用set集合的数据去重特征,记录各种访问数据
- 建立string类型数据,利用incr统计日访问量(PV)
- 建立set模型,记录不同cookie数量(UV)
- 建立set模型,记录不用IP数量(IP)
2.5 Zset(sorted_set)
- 新的存储需求:根据排序有利于数据的有效显示,需要提供一种可以根据自身特征进行排序的方式
- 需要的存储结构:新的存储模型,可以保存可排序的数据
- sorted_set类型:在set的存储结构基础上添加可排序字段
2.5.1 基本操作
- 添加数据
zadd key score1 member1 [score2 member2]
- 获取全部数据
zrange key start stop [WITHSCORES] #升序
zrevrange key start stop [WITHSCORES] #降序
- 删除数据
zrem key member [member …]
- 按条件获取数据
zrangebyscore key min max [WITHSCORES] [LIMIT]
zrevrangebyscore key max min [WITHSCORES]
- 条件删除
zremrangebyrank key start stop
zremrangebyscore key min max
- 获取集合数据总量
zcard key
zcount key min max #score再min和max间有多少数据
- 集合交、并操作
zinterstore destination numkeys key [key …]
zunionstore destination numkeys key [key …]
注意:
- min与max用于限定搜索查询的条件
- start与stop用于限定查询范围,作用于索引,表示开始和结束索引
- offset与count用于限定查询范围,作用于查询结果,表示开始位置和数据总量
2.5.2 zset类型扩展操作
解决方案
- 获取数据对应的索引(排名)
zrank key member
zrevrank key member
- score 值获取与修改
zscore key member
zincrby key increment member
3. Redis通用命令
3.1 key的通用操作
key特征
- key是一个字符串,通过key获取redis中保存的数据
key应该设计那些操作?
- 对于key自身状态的相关操作,例如:删除,判定存在,获取类型等
- 对于key有效性控制相关操作,例如:有效期设定,判定是否有效,有效状态的切换等
- 对于key快速查询操作,例如:按指定策略查询key
3.1.1 key的基本操作
- 删除指定key
del key
- 获取key是否存在
exists key
- 获取key的类型
type key
3.1.2 key的时效性操作
- 为指定key设置有效期
#单位秒
expire key seconds
#单位毫秒
pexpire key milliseconds
#秒的时间戳
expireat key timestamp
#毫秒的时间戳
pexpireat key millinseconds-timestamp
- 获取key有效时间
#返回剩余秒数, -1:永久有效, -2:不存在
ttl key
#返回剩余毫秒数, -1:永久有效, -2:不存在
pttl key
- 切换key从时效性转换为永久性
persist key
3.1.3 key的查询操作
- 查询key, pattern代表的查询模式
keys pattern
查询模式规则
3.1.4 key的其他操作
- 为key改名,慎重使用
#如果已经有newkey的数据,直接覆盖
rename key newkey
#如果已经有,则失败
renamenx key newkey
- 对所有key排序
sort
- 其他key通用操作
help @generic
3.2 数据库的通用操作
3.2.1db 基本操作
- 切换数据库
select index
- 其他操作
quit
ping
echo message
- 数据移动
move key db
- 数据清除[慎用]
dbsize #查询库里有多少key
flushdb #清除当前数据库所有数据
flushall #清除所有数据库所有数据