通用唯一识别码——UUID(Python)

1 概述

UUID(Universally Unique Identity)的缩写,是一种软件建构的标准,通常由 32 字节 16 进制数表示(128 位),它可以保证时间和空间的唯一性。目前应用最广泛的 UUID 是微软的 GUIDs。

2 作用

UUID 让分布式系统所有元素都有唯一的辨识信息,让每个人都可以建立与他人不同的 UUID,不需考虑数据库建立时的名称重复问题。随机生成字符串,当成 token、用户账号、订单等。

3 原理

UUID 是指一台机器上生成的数字,他保证同一时空所有机器都是唯一的。

UUID 由以下几部分构成:

  1. 时间戳:根据当前时间或者时钟序列生成字符串
  2. 全剧唯一的机器识别号,根据网卡 MAC 地址或者 IP 获取,如果没有网卡则以其他方式获取。
  3. 随机数:机器自动随机一组序列

等等

4 算法

uuid 有 5 种生成算法,分别是 uuid1()、uuid2()、uuid3()、uuid4()、uuid5()。

1、uuid1() 基于时间戳

由 MAC 地址、当前时间戳、随机数字。保证全球范围内的唯一性。但是由于 MAC 地址使用会带来安全问题,局域网内使用 IP 代替 MAC

2、uuid2() 基于分布式环境 DCE

算法和 uuid1 相同,不同的是把时间戳前四位换成 POIX 的 UID,实际很少使用。
注意:python 中没有这个函数

3、uuid3() 基于名字和 MD5 散列值

通过计算名字和命名空间的 MD5 散列值得到的,保证了同一命名空间中不同名字的唯一性,不同命名空间的唯一性。但是同一命名空间相同名字生成相同的 uuid。

4、uuid4() 基于随机数

由伪随机数得到的,有一定重复概率,这个概率是可以算出来的

5、uuid5() 基于名字和 SAHI 值

算法和 uuid3 相同,不同的是使用 SAHI 算法

5 使用经验

  1. python 中没有 DCE,所以 uuid2 可以忽略
  2. uuid4 存在概率重复性,由于无映射性,最好不使用
  3. 如果全局的分布式环境下,最好使用 uuid1
  4. 若名字的唯一性要求,最好使用 uuid3 或者 uuid5

6 使用

import uuid
print(uuid.uuid1())
print(uuid.uuid4())
print(uuid.uuid3(uuid.NAMESPACE_DNS, "myname"))
print(uuid.uuid5(uuid.NAMESPACE_DNS, "myname"))

运行结果:

a8f5372c-2bb8-11eb-9da2-000c292b487b
17893888-3c02-434e-b207-a64ed87b8d15
86ade465-d446-3e2e-b52b-fe5589f9387f
3d30fd12-b931-53b1-98ed-25e755531898

猜你喜欢

转载自blog.csdn.net/happyjacob/article/details/109705616