无锁唯一id生成

首先关于唯一id生成，个人比较推崇美团的Leaf，具体介绍可见链接：

https://tech.meituan.com/2017/04/21/mt-leaf.html

但这个框架未免有些太重了，笔者之前看到项目中生成方式是时间戳（精确到秒）+四位随机（数字+字母）的方式，看起来简单轻巧，但在高并发场景遇到了重复的情况，为了不改变原有的唯一id的结构，笔者把心思动在了多台机器对同一种业务，如何保证后四位随机数不重复上，毕竟34(0到9，大写字母排除I和O)^4大概有100W个数字，一秒并发超过100W的话只能修改原id结构中时间戳精确到毫秒，如果一毫秒并发超过100W，这大概是一秒1个亿的量级，其实可以吧四位随机字母改成6位，此时是1秒1000亿的量级，暂时应该没有业务并发量能有这个级别吧。

言归正传，关于如何保证多级四位字母不重复上，首先我们吧这个问题转换成如何保证多级四位34进制的数字不重复，转换为10进制就是如何保证多机对一个100W以内的数字不重复。最简单的方式当然是redis自增，但这样每次获取id都要连接一次redis，未免有些太过耗时

为了解决上述问题，我们可以引入atomicLong，并把1000W分成1000个数字*1000组，每个机器初始取的一个所在组，然后本地使用atomicLong自增，我们取它与1000的余数作为当前数字，当次数字达到999，则在redis触发一次自增，其他情况只要atomicLong自增即可。这样多台机器在每秒100W的id生成量以内，都不会产生重复。

最后我们聊一下同一秒内唯一id太密集的情况，对此我们可以采取已组做尾数，atomicLong*1000组合成数字的方式，并引入栅栏加密，最后打乱字母与数字顺序的方式。

当然问题也有以下几点：

1、强依赖redis，一旦redis出现问题，atomicLong达到999后，下一次生成必定失败，并且单台机器后续吞吐量只能达到每秒1000

2、如果生产有20台机器，其中一台机器初始化所在组后，产生网络问题导致后续请求均未到达此机器，问题修复后可能出现此机器组别与其他机器重复，导致id重复的情况

当然以上两种情况相对都是小概率事件，同事我们还有时间戳保证id的唯一性，所以可以在很大程度上忽略此问题，最后附上核心代码如下图：

猜你喜欢