公司需要有个可以提供统一编号的服务，如果系统小时，唯一标识的产生，可以用公用模块来处理，比如数据库表唯一键、缓存的唯一id等方式，但是在分布式高并发系统中，如果还是用公共模块，会有很大的风险和瓶颈，从网上查了几种方案对比如下：
在这里插入图片描述
经过以上对比考虑使用twitter的雪花算法Snowflake。

Snowflake：

64位达到要求：

在这里插入图片描述
主要由3块构成：时间戳、工作机器id、序列号。

其中第一位不用，也可以理解作为正负数来使用，默认正数的。
随后41位表示时间戳，在实际使用时，可以当做时间差来使用，比如现在离2017-01-01 00:00:00的时间差。这样的话，时间范围就能达到： (2^41-1)/(1000606024365)=69.7年。
中间10位用于工作机器的。可以用于 2^10-1=1023台机器。
最后12位表示序列号，一个机器在一个毫秒时最大能产生 2^12-1=4095个。

扩展：

在实际应用中，可能无需最大化的，比如时间戳只用30位就能达到要求的就无需41位，其他的同理。
工作机器ID，可以是进程级别。机器级别的话，可以使用机器的mac地址或ip地址经过算法；如果是进程级别的话，可以使用path+进程标识；也可以混编，列如前5位标识机器，后5位标识进程。
关于序列号有个注意点，如果一个毫秒内，序列号已经达到上限，就等到下一毫秒，同时序列号置零开始。

它可以做到：

所有生成的id按时间递增
整个分布式系统中不会产生相同的id（因为有datacenterId和mechineId来区分）
满足了预期服务时间内（即多少年内）算法适用

核心代码参考：

https://github.com/beyondfengyu/SnowFlake

种下星星的日子

发布了253 篇原创文章 · 获赞 76 · 访问量 29万+

他的留言板关注

获取统一编号服务-SnowFlake雪花算法

Snowflake：

64位达到要求：

扩展：

它可以做到：

核心代码参考：

猜你喜欢