可计算、高性能的自定义用户字段方案

网络上自定义字段的方案有很多,如果是关系型数据库,大部分都涉及到动态加列;如果是非关系型数据库,可以直接用一个对象存,但是不可能每个字段都加索引,查询效率得不到保证。

这里分享一下另一种取巧的思路,既能保证可通过自定义字段检索,又能实现超高的查询效率。我们采用 redis 和持久化数据库结合的方式。

redis namespace 设计

一个用户自定义字段(User Defined Field,简称 udf)在 redis 存储的 key 格式为:udf:filedName,如下图所示:

它对应的数据结构为 hash ,field 为字段值,value 为用户 ID 列表(以逗号间隔)。

持久性数据库(mysql, postgresql, mongodb 等 ),保存 JSON 字符串。

我们需要保持 redis 和 mongo/mysql/postgres 之间数据同步。这一点并不难,只涉及到字段的添加、删除、修改,保持两边同步就行了。

查询示例

场景一:普通类型值全等查询

要查询 favorColour = "RED" 的所有用户:

其中 redis key 为 udf:favorColour

值:

{
    "RED": "用户ID 1",
    "BLUE": "用户ID 2",
    "BLACK": "用户ID 3,用户ID 4"
}
复制代码

查询步骤如下:

  1. hget udf:favorColour RED ,时间复杂度为 O(1)
  2. 如果存在,得到一个字符串,将这个字符串解析成一个用户ID列表,从而查询到相关用户
  3. 如果不存在,得到 null,说明没有用户满足条件

场景二:集合类型值 in 查询

要查询「感兴趣专业」中包含「计算机科学与技术」的所有用户。

redis key 为 udf:interestedCourses

值:

{
    "计算机科学与技术": "用户ID1,用户ID2"
}
复制代码

查询步骤如下:(和上述一致)

  • hget udf:interestedCourses RED ,时间复杂度为 O(1)
  • 如果存在,得到一个字符串,将这个字符串解析成一个用户ID列表,从而查询到相关用户
  • 如果不存在,得到 null,说明没有用户满足条件

场景三:查询某个用户具有的所有自定义字段数据

这里直接根据用户 ID 在数据库中查,时间复杂度依旧是 O(1),查到之后直接将字符串转换成 JSON 即可。

猜你喜欢

转载自juejin.im/post/5e67a4f6e51d4526c47ae2be
今日推荐