Redis-04、常用数据类型:set、zset

set

Redis 的 Set 是 string 类型的无序集合。
集合是通过哈希表实现的,所以添加,删除,查找的复杂度都是 O(1)。

  • 新的存储需求:存储大量的数据,在查询方面提供更高的效率
  • 需要的存储结构:能够保存大量的数据,高效的内部存储机制,便于查询
  • set类型:与hash存储结构完全相同,仅存储键,不存储值( nil),并且值是不允许重复的
image-20200412144145159 image-20200412144209832

基础命令

命令 功能
sadd key member1 [member2......] 添加数据
smembers key 获取全部数据
srem key member1 [member2] 删除数据
scard key 获取集合数据总
sismember key member 判断集合中是否包含指定数据
> sadd students zhangsan lisi wangwu
(integer) 3

> smembers students
1) "zhangsan"
2) "wangwu"
3) "lisi"

> srem students zhangsan
(integer) 1

> scard students
(integer) 2

> sismember students zhangsan
(integer) 0

扩展命令1

命令 功能
srandmember key [count] 随机获取集合中指定数量的数据
spop key [count] 随机获取集合中的某个数据并将该数据移出集合
srandmember students
"lisi"
> srandmember students 2
1) "wangwu"
2) "lisi"

> spop students
"wangwu"

扩展命令2

命令 功能
sinter key1 [key2] 求两个集合的交集
sunion key1 [key2] 求两个集合的并集
sdiff key1 [key2] 求两个集合的差集,前-后
sinterstore destination key1 [key2] 求两个集合的交集并存储到指定集合中
sunionstore destination key1 [key2] 求两个集合的并集并存储到指定集合中
sdiffstore destination key1 [key2] 求两个集合的差集并存储到指定集合中
smove source destination member 将指定数据从原始集合中移动到目标集合中
> sunion students teacher
1) "zhangsan"
2) "lisi"
3) "yuwen"
4) "shuxue"

应用场景

业务场景1

每位用户首次使用今日头条时会设置3项爱好的内容,但是后期为了增加用户的活跃度、兴趣点,必须让用户对其他信息类别逐渐产生兴趣,增加客户留存度,如何实现?

业务分析

  • 系统分析出各个分类的最新或最热点信息条目并组织成set集合
  • 随机挑选其中部分信息
  • 配合用户关注信息分类中的热点信息组织成展示的全信息集合

解决方案

  • 随机获取集合中指定数量的数据
  • 随机获取集合中的某个数据并将该数据移出集合

业务场景2

脉脉为了促进用户间的交流,保障业务成单率的提升,需要让每位用户拥有大量的好友,事实上职场新人不
具有更多的职场好友,如何快速为用户积累更多的好友?

新浪微博为了增加用户热度,提高用户留存性,需要微博用户在关注更多的人,以此获得更多的信息或热门
话题,如何提高用户关注他人的总量?

解决方案

  • 求两个集合的交、并、差集
  • 求两个集合的交、并、差集并存储到指定集合中
  • 将指定数据从原始集合中移动到目标集合中

业务场景3

集团公司共具有12000名员工,内部OA系统中具有700多个角色, 3000多个业务操作, 23000多种数据,每
位员工具有一个或多个角色,如何快速进行业务操作的权限校验

公司对旗下新的网站做推广,统计网站的PV(访问量) ,UV(独立访客) ,IP(独立IP)。

解决方案

  • 利用set集合的数据去重特征,记录各种访问数据
  • 建立string类型数据,利用incr统计日访问量( PV)
  • 建立set模型,记录不同cookie数量( UV)
  • 建立set模型,记录不同IP数量( IP)

业务场景4

黑名单
资讯类信息类网站追求高访问量,但是由于其信息的价值,往往容易被不法分子利用,通过爬虫技术,
快速获取信息,个别特种行业网站信息通过爬虫获取分析后,可以转换成商业机密进行出售。例如第三方火
车票、机票、酒店刷票代购软件,电商刷评论、刷好评。
同时爬虫带来的伪流量也会给经营者带来错觉,产生错误的决策,有效避免网站被爬虫反复爬取成为每
个网站都要考虑的基本问题。在基于技术层面区分出爬虫用户后,需要将此类用户进行有效的屏蔽,这就是
黑名单的典型应用。
ps:不是说爬虫一定做摧毁性的工作,有些小型网站需要爬虫为其带来一些流量。
白名单
对于安全性更高的应用访问,仅仅靠黑名单是不能解决安全问题的,此时需要设定可访问的用户群体,
依赖白名单做更为苛刻的访问验证

解决方案

  • 基于经营战略设定问题用户发现、鉴别规则
  • 周期性更新满足规则的用户黑名单,加入set集合
  • 用户行为信息达到后与黑名单进行比对,确认行为去向
  • 黑名单过滤IP地址:应用于开放游客访问权限的信息源
  • 黑名单过滤设备信息:应用于限定访问设备的信息源
  • 黑名单过滤用户:应用于基于访问权限的信息源

set的应用

  • redis 应用于随机推荐类信息检索,例如热点歌单推荐,热点新闻推荐,热卖旅游线路,应用APP推荐,大V推荐等

  • redis 应用于同类信息的关联搜索,二度关联搜索,深度关联搜索
    显示共同关注(一度)
    显示共同好友(一度)
    由用户A出发,获取到好友用户B的好友信息列表(一度)
    由用户A出发,获取到好友用户B的购物清单列表(二度)
    由用户A出发,获取到好友用户B的游戏充值列表(二度)

  • redis 应用于同类型数据的快速去重

  • redis 应用于基于黑名单与白名单设定的服务控制

注意事项

  • set 类型不允许数据重复,如果添加的数据在 set 中已经存在,将只保留一份
  • set 虽然与hash的存储结构相同,但是无法启用hash中存储值的空间

sorted_set

Redis zset 和 set 一样也是string类型元素的集合,且不允许重复的成员。

不同的是每个元素都会关联一个double类型的分数。redis正是通过分数来为集合中的成员进行从小到大的排序。zset的成员是唯一的,但分数(score)却可以重复。

  • 新的存储需求:数据排序有利于数据的有效展示,需要提供一种可以根据自身特征进行排序的方式
  • 需要的存储结构:新的存储模型,可以保存可排序的数据
  • sorted_set类型:在set的存储结构基础上添加可排序字段
image-20200412171628483

基础命令

命令 功能
zadd key score1 member1 [score2 member2...] 添加数据
zrange key start stop [WITHSCORES] 升序排序,获取指定排名区间的所有数据
zrevrange key start stop [WITHSCORES] 降序排序,获取指定排名区间的所有数据
zrem key member [member ...] 删除指定数据
zrangebyscore key min max [WITHSCORES] [LIMIT] 升序排序,获取指定分数区间的数据
zrevrangebyscore key max min [WITHSCORES] 降序排序......
zremrangebyrank key start stop 移除有序集合中,指定排名(rank)区间内的所有数据
zremrangebyscore key min max 移除有序集合中,指定分数区间内的所有数据
zcard key 获取集合数据总量
zcount key min max 获取集合指定分数区间的数据总量
zinterstore destination numkeys key [key ...] 将两个有序集合的交集合并到一个新的有序集合
zunionstore destination numkeys key [key ...] 将两个有序集合的并集合并到一个新的有序集合
> zadd zs 10 fir 8 sec 4 thi
(integer) 3

> zrange zs 0 2
1) "thi"
2) "sec"
3) "fir"

> zrevrange zs 0 -1 withscores
1) "fir"
2) "10"
3) "sec"
4) "8"
5) "thi"
6) "7"

//> zrem zs thi
//(integer) 1

> zrangebyscore zs 7 10 withscores
1) "sec"
2) "8"
3) "fir"
4) "10"

扩展命令

命令 功能
zrank key member 获取数据对应的索引(排名),按升序
zrevrank key member 获取数据对应的索引(排名),按降序
zscore key member 获取指定数据的分数
zincrby key increment member 为指定增加(可以为负数,可以为小数)
> zrank zs thi
(integer) 0

> zrevrank zs sec
(integer) 1

> zscore zs fir
"10"

> zincrby zs 5 fir
"15"
> zincrby zs -4.5 fir
"10.5"

应用场景

业务场景1

票选广东十大杰出青年,各类综艺选秀海选投票
各类资源网站TOP10(电影,歌曲,文档,电商,游戏等)
聊天室活跃度统计
游戏好友亲密度

业务分析

  • 为所有参与排名的资源建立排序依据

解决方案

  • 获取数据对应的索引(排名)
  • score值获取与修改

业务场景2

​ 基础服务+增值服务类网站会设定各位会员的试用,让用户充分体验会员优势。例如观影试用VIP、游戏
VIP体验、云盘下载体验VIP、数据查看体验VIP。当VIP体验到期后,如果有效管理此类信息。即便对于正式
VIP用户也存在对应的管理方式。
​ 网站会定期开启投票、讨论,限时进行,逾期作废。如何有效管理此类过期信息。

解决方案

  • 对于基于时间线限定的任务处理,将处理时间记录为score值,利用排序功能区分处理的先后顺序

  • 记录下一个要处理的时间,当到期后处理对应任务,移除redis中的记录,并记录下一个要处理的时间

  • 当新任务加入时,判定并更新当前下一个要处理的任务时间

  • 为提升sorted_set的性能,通常将任务根据特征存储成若干个sorted_set。例如1小时内, 1天内,周内,
    月内,季内,年度等,操作时逐级提升,将即将操作的若干个任务纳入到1小时内处理的队列中

  • 获取当前系统时间

    time

业务场景3

任务/消息权重设定应用
当任务或者消息待处理,形成了任务队列或消息队列时,对于高优先级的任务要保障对其优先处理,如
何实现任务权重管理。

解决方案

  • 对于带有权重的任务,优先处理权重高的任务,采用score记录权重即可
    多条件任务权重设定
    如果权重条件过多时,需要对排序score值进行处理,保障score值能够兼容2条件或者多条件,例如外贸
    订单优先于国内订单,总裁订单优先于员工订单,经理订单优先于员工订单
  • 因score长度受限,需要对数据进行截断处理,尤其是时间设置为小时或分钟级即可(折算后)
  • 先设定订单类别,后设定订单发起角色类别,整体score长度必须是统一的,不足位补0。第一排序规则首
    位不得是0
  • 例如外贸101,国内102,经理004,员工008。
  • 员工下的外贸单score值为101008(优先)
  • 经理下的国内单score值为102004

zset的应用

  • redis 应用于计数器组合排序功能对应的排名
  • redis 应用于定时任务执行顺序管理或任务过期管理
  • redis 应用于即时任务/消息队列执行管理
  • redis 应用于限时按次结算的服务控制

注意事项

  • score保存的数据存储空间是64位,如果是整数范围是-9007199254740992~9007199254740992
  • score保存的数据也可以是一个双精度的double值,基于双精度浮点数的特征,可能会丢失精度,使用时
    候要慎重
  • sorted_set 底层存储还是基于set结构的,因此数据不能重复,如果重复添加相同的数据, score值将被反
    复覆盖,保留最后一次修改的结果

猜你喜欢

转载自www.cnblogs.com/sout-ch233/p/12721557.html