Redis-04、常用数据类型：set、zset

set

Redis 的 Set 是 string 类型的无序集合。
集合是通过哈希表实现的，所以添加，删除，查找的复杂度都是 O(1)。

新的存储需求：存储大量的数据，在查询方面提供更高的效率
需要的存储结构：能够保存大量的数据，高效的内部存储机制，便于查询
set类型：与hash存储结构完全相同，仅存储键，不存储值（ nil），并且值是不允许重复的

基础命令

命令	功能
sadd key member1 [member2......]	添加数据
smembers key	获取全部数据
srem key member1 [member2]	删除数据
scard key	获取集合数据总
sismember key member	判断集合中是否包含指定数据

> sadd students zhangsan lisi wangwu
(integer) 3

> smembers students
1) "zhangsan"
2) "wangwu"
3) "lisi"

> srem students zhangsan
(integer) 1

> scard students
(integer) 2

> sismember students zhangsan
(integer) 0

扩展命令1

命令	功能
srandmember key [count]	随机获取集合中指定数量的数据
spop key [count]	随机获取集合中的某个数据并将该数据移出集合

srandmember students
"lisi"
> srandmember students 2
1) "wangwu"
2) "lisi"

> spop students
"wangwu"

扩展命令2

命令	功能
sinter key1 [key2]	求两个集合的交集
sunion key1 [key2]	求两个集合的并集
sdiff key1 [key2]	求两个集合的差集，前-后
sinterstore destination key1 [key2]	求两个集合的交集并存储到指定集合中
sunionstore destination key1 [key2]	求两个集合的并集并存储到指定集合中
sdiffstore destination key1 [key2]	求两个集合的差集并存储到指定集合中
smove source destination member	将指定数据从原始集合中移动到目标集合中

> sunion students teacher
1) "zhangsan"
2) "lisi"
3) "yuwen"
4) "shuxue"

应用场景

业务场景1

每位用户首次使用今日头条时会设置3项爱好的内容，但是后期为了增加用户的活跃度、兴趣点，必须让用户对其他信息类别逐渐产生兴趣，增加客户留存度，如何实现？

业务分析

系统分析出各个分类的最新或最热点信息条目并组织成set集合
随机挑选其中部分信息
配合用户关注信息分类中的热点信息组织成展示的全信息集合

解决方案

随机获取集合中指定数量的数据
随机获取集合中的某个数据并将该数据移出集合

业务场景2

脉脉为了促进用户间的交流，保障业务成单率的提升，需要让每位用户拥有大量的好友，事实上职场新人不
具有更多的职场好友，如何快速为用户积累更多的好友？

新浪微博为了增加用户热度，提高用户留存性，需要微博用户在关注更多的人，以此获得更多的信息或热门
话题，如何提高用户关注他人的总量？

解决方案

求两个集合的交、并、差集
求两个集合的交、并、差集并存储到指定集合中
将指定数据从原始集合中移动到目标集合中

业务场景3

集团公司共具有12000名员工，内部OA系统中具有700多个角色， 3000多个业务操作， 23000多种数据，每
位员工具有一个或多个角色，如何快速进行业务操作的权限校验

公司对旗下新的网站做推广，统计网站的PV（访问量） ,UV（独立访客） ,IP（独立IP）。

解决方案

利用set集合的数据去重特征，记录各种访问数据
建立string类型数据，利用incr统计日访问量（ PV）
建立set模型，记录不同cookie数量（ UV）
建立set模型，记录不同IP数量（ IP）

业务场景4

黑名单
资讯类信息类网站追求高访问量，但是由于其信息的价值，往往容易被不法分子利用，通过爬虫技术，
快速获取信息，个别特种行业网站信息通过爬虫获取分析后，可以转换成商业机密进行出售。例如第三方火
车票、机票、酒店刷票代购软件，电商刷评论、刷好评。
同时爬虫带来的伪流量也会给经营者带来错觉，产生错误的决策，有效避免网站被爬虫反复爬取成为每
个网站都要考虑的基本问题。在基于技术层面区分出爬虫用户后，需要将此类用户进行有效的屏蔽，这就是
黑名单的典型应用。
ps:不是说爬虫一定做摧毁性的工作，有些小型网站需要爬虫为其带来一些流量。
白名单
对于安全性更高的应用访问，仅仅靠黑名单是不能解决安全问题的，此时需要设定可访问的用户群体，
依赖白名单做更为苛刻的访问验证

解决方案

基于经营战略设定问题用户发现、鉴别规则
周期性更新满足规则的用户黑名单，加入set集合
用户行为信息达到后与黑名单进行比对，确认行为去向
黑名单过滤IP地址：应用于开放游客访问权限的信息源
黑名单过滤设备信息：应用于限定访问设备的信息源
黑名单过滤用户：应用于基于访问权限的信息源

set的应用

redis 应用于随机推荐类信息检索，例如热点歌单推荐，热点新闻推荐，热卖旅游线路，应用APP推荐，大V推荐等
redis 应用于同类信息的关联搜索，二度关联搜索，深度关联搜索
显示共同关注（一度）
显示共同好友（一度）
由用户A出发，获取到好友用户B的好友信息列表（一度）
由用户A出发，获取到好友用户B的购物清单列表（二度）
由用户A出发，获取到好友用户B的游戏充值列表（二度）
redis 应用于同类型数据的快速去重
redis 应用于基于黑名单与白名单设定的服务控制

注意事项

set 类型不允许数据重复，如果添加的数据在 set 中已经存在，将只保留一份
set 虽然与hash的存储结构相同，但是无法启用hash中存储值的空间

sorted_set

Redis zset 和 set 一样也是string类型元素的集合,且不允许重复的成员。

不同的是每个元素都会关联一个double类型的分数。redis正是通过分数来为集合中的成员进行从小到大的排序。zset的成员是唯一的,但分数(score)却可以重复。

新的存储需求：数据排序有利于数据的有效展示，需要提供一种可以根据自身特征进行排序的方式
需要的存储结构：新的存储模型，可以保存可排序的数据
sorted_set类型：在set的存储结构基础上添加可排序字段

基础命令

命令	功能
zadd key score1 member1 [score2 member2...]	添加数据
zrange key start stop [WITHSCORES]	升序排序，获取指定排名区间的所有数据
zrevrange key start stop [WITHSCORES]	降序排序，获取指定排名区间的所有数据
zrem key member [member ...]	删除指定数据
zrangebyscore key min max [WITHSCORES] [LIMIT]	升序排序，获取指定分数区间的数据
zrevrangebyscore key max min [WITHSCORES]	降序排序......
zremrangebyrank key start stop	移除有序集合中，指定排名(rank)区间内的所有数据
zremrangebyscore key min max	移除有序集合中，指定分数区间内的所有数据
zcard key	获取集合数据总量
zcount key min max	获取集合指定分数区间的数据总量
zinterstore destination numkeys key [key ...]	将两个有序集合的交集合并到一个新的有序集合
zunionstore destination numkeys key [key ...]	将两个有序集合的并集合并到一个新的有序集合

> zadd zs 10 fir 8 sec 4 thi
(integer) 3

> zrange zs 0 2
1) "thi"
2) "sec"
3) "fir"

> zrevrange zs 0 -1 withscores
1) "fir"
2) "10"
3) "sec"
4) "8"
5) "thi"
6) "7"

//> zrem zs thi
//(integer) 1

> zrangebyscore zs 7 10 withscores
1) "sec"
2) "8"
3) "fir"
4) "10"

扩展命令

命令	功能
zrank key member	获取数据对应的索引（排名），按升序
zrevrank key member	获取数据对应的索引（排名），按降序
zscore key member	获取指定数据的分数
zincrby key increment member	为指定增加(可以为负数，可以为小数)

> zrank zs thi
(integer) 0

> zrevrank zs sec
(integer) 1

> zscore zs fir
"10"

> zincrby zs 5 fir
"15"
> zincrby zs -4.5 fir
"10.5"

应用场景

业务场景1

票选广东十大杰出青年，各类综艺选秀海选投票
各类资源网站TOP10（电影，歌曲，文档，电商，游戏等）
聊天室活跃度统计
游戏好友亲密度

业务分析

为所有参与排名的资源建立排序依据

解决方案

获取数据对应的索引（排名）
score值获取与修改

业务场景2

基础服务+增值服务类网站会设定各位会员的试用，让用户充分体验会员优势。例如观影试用VIP、游戏
VIP体验、云盘下载体验VIP、数据查看体验VIP。当VIP体验到期后，如果有效管理此类信息。即便对于正式
VIP用户也存在对应的管理方式。
网站会定期开启投票、讨论，限时进行，逾期作废。如何有效管理此类过期信息。

解决方案

对于基于时间线限定的任务处理，将处理时间记录为score值，利用排序功能区分处理的先后顺序
记录下一个要处理的时间，当到期后处理对应任务，移除redis中的记录，并记录下一个要处理的时间
当新任务加入时，判定并更新当前下一个要处理的任务时间
为提升sorted_set的性能，通常将任务根据特征存储成若干个sorted_set。例如1小时内， 1天内，周内，
月内，季内，年度等，操作时逐级提升，将即将操作的若干个任务纳入到1小时内处理的队列中
获取当前系统时间

time

业务场景3

任务/消息权重设定应用
当任务或者消息待处理，形成了任务队列或消息队列时，对于高优先级的任务要保障对其优先处理，如
何实现任务权重管理。

解决方案

对于带有权重的任务，优先处理权重高的任务，采用score记录权重即可
多条件任务权重设定
如果权重条件过多时，需要对排序score值进行处理，保障score值能够兼容2条件或者多条件，例如外贸
订单优先于国内订单，总裁订单优先于员工订单，经理订单优先于员工订单
因score长度受限，需要对数据进行截断处理，尤其是时间设置为小时或分钟级即可（折算后）
先设定订单类别，后设定订单发起角色类别，整体score长度必须是统一的，不足位补0。第一排序规则首
位不得是0
例如外贸101，国内102，经理004，员工008。
员工下的外贸单score值为101008（优先）
经理下的国内单score值为102004

zset的应用

redis 应用于计数器组合排序功能对应的排名
redis 应用于定时任务执行顺序管理或任务过期管理
redis 应用于即时任务/消息队列执行管理
redis 应用于限时按次结算的服务控制

注意事项

score保存的数据存储空间是64位，如果是整数范围是-9007199254740992~9007199254740992
score保存的数据也可以是一个双精度的double值，基于双精度浮点数的特征，可能会丢失精度，使用时
候要慎重
sorted_set 底层存储还是基于set结构的，因此数据不能重复，如果重复添加相同的数据， score值将被反
复覆盖，保留最后一次修改的结果