获取统一编号服务-SnowFlake雪花算法

公司需要有个可以提供统一编号的服务,如果系统小时,唯一标识的产生,可以用公用模块来处理,比如数据库表唯一键、缓存的唯一id等方式,但是在分布式高并发系统中,如果还是用公共模块,会有很大的风险和瓶颈,从网上查了几种方案对比如下:
在这里插入图片描述
经过以上对比考虑使用twitter的雪花算法Snowflake。

Snowflake:

64位达到要求:

在这里插入图片描述
主要由3块构成:时间戳、工作机器id、序列号。

  • 其中第一位不用,也可以理解作为正负数来使用,默认正数的。
  • 随后41位表示时间戳,在实际使用时,可以当做时间差来使用,比如现在离2017-01-01 00:00:00的时间差。这样的话,时间范围就能达到: (2^41-1)/(1000606024365)=69.7年。
  • 中间10位用于工作机器的。可以用于 2^10-1=1023台机器。
  • 最后12位表示序列号,一个机器在一个毫秒时最大能产生 2^12-1=4095个。

扩展:

在实际应用中,可能无需最大化的,比如时间戳只用30位就能达到要求的就无需41位,其他的同理。
工作机器ID,可以是进程级别。机器级别的话,可以使用机器的mac地址或ip地址经过算法;如果是进程级别的话,可以使用path+进程标识;也可以混编,列如前5位标识机器,后5位标识进程。
关于序列号有个注意点,如果一个毫秒内,序列号已经达到上限,就等到下一毫秒,同时序列号置零开始。

它可以做到:

  • 所有生成的id按时间递增
  • 整个分布式系统中不会产生相同的id(因为有datacenterId和mechineId来区分)
  • 满足了预期服务时间内(即多少年内)算法适用

核心代码参考:

https://github.com/beyondfengyu/SnowFlake

发布了253 篇原创文章 · 获赞 76 · 访问量 29万+

猜你喜欢

转载自blog.csdn.net/hongwei15732623364/article/details/83064451