百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

了解使用RFC标准如何生成UUID(rfc_read_table)

nanshan 2024-11-14 16:38 14 浏览 0 评论

更多互联网新鲜资讯、工作奇淫技巧关注原创【飞鱼在浪屿】(日更新)

RFC 4122介绍了UUID的现代实现,引入了5种不同的方法来生成这些标识符。本文将逐一介绍一下,稍后将逐步介绍版本1和版本4的实现细节。

https://tools.ietf.org/html/rfc4122


背景

UUID(通用唯一IDentifiers)是一个128位数字,用于软件开发中标识唯一的项目。规范文本表示形式是一串32个十六进制字符,这些字符由中划线字符组成,形式为8-4-4-4-12。

例如,

3422b448-2460-4fd2-9183-8000de6f8343

这个看似随机的十六进制字符中的有关UUID实现的信息。

xxxxxxxx-xxxx-Mxxx-Nxxx-xxxxxxxxxxxx

M和N位置中的值分别标识唯一UUID版本号和变体


版本号:

通过查看M位置值的最高4位来标识版本号。

下表列出了当前定义的版本:


变体

N的前1-3个最高有效位来识别变体。

如今,最常见的实现是变体1,其中MSB0固定为1,MSB1固定为0。这意味着,考虑到通配符值(x上面标记的位),唯一可能的值是8、9,A或B 。

快速提示:

1 0 0 0 = 8

1 0 0 1 = 9

1 0 1 0 = A

1 0 1 1 = B

因此,如果看到N位置带有这些值的UUID,它是常见的Variant 1类型。


版本1(基于时间+唯一或随机主机标识符)

在此版本中,UUID是通过获取当前时间戳和生成UUID的设备的某些标识属性(最常见的是MAC地址(也称为节点ID))生成的。

通过将48位MAC地址,60位时间戳和14位“唯一化”时钟序列,以及用于版本和变体的6个保留位进行级联以生成唯一的UUID,可以生成此UUID。

时钟序列只是每次修改时钟时都会增加的值。

此版本中使用的时间戳记是自1582年10月15日(公历改制为基督教历法之日)以来的100纳秒时间间隔数。

自大纪元以来,你可能熟悉Unix系统和时间。这只是第0天的不同之处网上有几种算法可将一个时间表示形式转换为另一个时间表示形式。

尽管此实现看起来相当简单和健壮,但由于它可以显示生成它的机器的MAC地址,因此该方法并不适合所有用例。特别是主要问题是安全时。取而代之的是,某些实现将使用来自加密安全随机数生成器的6个随机字节来代替节点ID。

要组装出版本1的UUID,将执行以下步骤:

  1. 取当前UTC时间戳的32位。这将是我们的UUID [TimeLow]的前4个字节/或8个十六进制字符
  2. 取当前UTC时间戳的中间16位。这些将是接下来2个字节/或4个十六进制字符。[TimeMid]
  3. 4位UUID版本和当前UTC时间戳的其余高12位(共60位),将合并成剩下的2个字节/或4个十六进制字符。[TimeHighAndVersion]
  4. 接下来的1-3位将是UUID版本的变体。剩下的其余位包含时钟序列,该时钟序列(实际上是随机数)目的是为该实现提供少量的随机性。这样也可以避免在同一系统上UUID生成器的系统时钟不够快时发生冲突的情况。[ClockSequenceHiAndRes && ClockSequenceLow]
  5. 最后的6个字节/或12个十六进制字符/或48位是“节点ID”,通常是设备的MAC地址。[NodeID]

将所有内容放在一起,版本1的UUID是通过以下串联生成的:

TimeLow + TimeMid + TimeHighAndVersion + (ClockSequenceHiAndRes && ClockSequenceLow) + NodeID

由于此实现依赖于时钟,因此需要处理一些边缘情况。首先,为了最小化系统之间的相关性,时钟序列默认设置为随机数-这只会在系统生命周期内发生一次。这具有额外的好处,因为时钟序列的初始值完全与节点标识符无关,因此可以支持可能在系统之间移动的节点标识符。

时钟序列的主要目的是在方程中引入一定程度的随机性。为时钟序列分配的位有助于扩展时间戳,并解决在同一处理器时钟生成多个UUID的情况。这避免在时钟倒退设置(设备关闭电源)或节点ID更改时可能产生重复。如果时钟是向后设置的,或者可能是向后设置的(例如,在系统关闭电源时),并且UUID生成器无法确定将来生成的UUID时间戳是否大于设置的时钟值,那么必须更改时钟序列。如果知道时钟序列的前一个值,则可以将其递增;


版本2(分布式计算环境安全性)

此版本与版本1之间的主要区别在于,此实现使用特定于系统的某些标识符来代替通过使用时钟序列的最低有效位生成的“随机性”。该值通常是当前用户的ID。此版本不那么常见,并且与版本1的偏差很小。


版本3(基于命名空间+ MD5哈希)

如果想使用命名空间中的信息或更普遍的“可命名”信息拥有唯一的标识符,则首选UUID版本3和版本5。

任何“可命名”实体(网站,DNS信息,纯文本等)编码为UUID值。这里的主要要注意的是,对于相同的命名空间和文本,生成的UUID将相同。

请注意,命名空间本身是UUID。

let namespace = “digitalbunker.dev”
let namespaceUUID = UUID3(.DNS, namespace)

// Ex: 
UUID3(namespaceUUID, “/category/things-you-should-know-1/”) 
4896c91b-9e61-3129-87b6-8aa299028058

UUID3(namespaceUUID, “/category/things-you-should-know-2/”) 
29be0ee3-fe77-331e-a1bf-9494ec18c0ba

UUID3(namespaceUUID, “/category/things-you-should-know-3/”) 
33b06619-1ee7-3db5-827d-0dc85df1f759

在此实现中,命名空间的UUID转换为字节串,与输入名称连接在一起,然后用MD5散列,从而为UUID生成128位。然后,覆盖其中的某些位以准确反映版本和变体信息,而其余部分保持不变。

无论是名称空间还是输入的名称都不能从UUID逆向生成。这是单向操作。

对于版本3和版本5,只要使用相同的输入,生成的UUID将是确定性的。


版本4(PRNG伪随机)

这可能是最简单的实现。

版本和变体信息保留了6位,然后可以自由决定122位。此版本仅生成所有128个随机位,然后作为第二步骤填写版本和变体信息的值。

这种类型的UUID严重依赖于所用PRNG(伪随机数生成器)算法的质量。如果PRNG缺少复杂的算法或正确的种子和初始化值,则重复的可能性会增加。

第4版是现代编程语言中最常实现的版本。

它的实现相当简单。

  1. 产生128个随机位
  2. 使用版本和变体信息覆盖其中的某些位。取第7个字节,然后和0x0F进行AND操作以清除高半字节。然后,将其与0x40设置版本号为4。 接下来,取第9个字节,和0x3F进行与运算,或和0x80进行或运输
  3. 将128位转换为十六进制表示,并插入中划线字符以实现规范的文本表示。

版本5(基于名称+ SHA-1哈希)

此版本与版本3相同,不同之处在于,SHA-1此处使用哈希算法代替MD5。此版本优于版本3(SHA-1> MD5)。


在实践中

UUID的显着优势之一是其唯一性不取决于中央机构或不同系统之间的协调。任何人都可以创建UUID,并有合理保证确保不存在重复值,并且可以想象将来不会重复。

这具有额外的好处,即允许将生成的独立UUID写入到单个数据库中,或以很小的重复/冲突概率跨数据库移动。

由于这种唯一性,可以将UUID用作数据库中的主键,将UUID用作上传文件的唯一文件名,对于任何Web资源都使用唯一名称,或者允许供应商创建和注册UUID而不需要中央权限。但是,这是一把双刃剑。由于缺乏中央权威,因此也无法跟踪以前发布的UUID。

还有一些缺点可以解决。尽管这种固有的随机性有助于提高安全性,但它会使调试等问题变得复杂。此外,在某些情况下,UUID可能会占用空间过大。例如,使用128位唯一标识一些本身可能小于128位的数据是没有意义的。


独特性

查看这些实现,似乎有足够的时间,最终会重复一个值。特别是在版本4的情况下,它依赖于随机数。但是,在实践中,为了获得重复的UUID,需要生成的数量和频率是相当大的。

如果在接下来的100年中每秒产生10亿个UUID,假设用于生成UUID的PRNG将足够的熵(“实际随机性”),否则重复计数的可能性会更高。在稍微实际的示例中,如果要生成10,000,000,000,000 [10万亿]个UUID,则两个UUID相同的机会为0.00000006%。

在第1版的情况下,时钟只能在公元3603年翻转。因此,除非打算将服务再运行1,583年,否则在也很安全。

重复的可能性仍然存在,某些系统确实设法解决了这一问题,但是对于绝大多数用例,UUID可以被视为真正唯一。


相关推荐

使用nginx配置域名及禁止直接通过IP访问网站

前段时间刚搭建好这个网站,一直没有关注一个问题,那就是IP地址也可以访问我的网站,今天就专门研究了一下nginx配置问题,争取把这个问题研究透彻。1.nginx配置域名及禁止直接通过IP访问先来看n...

如何在 Linux 中使用 PID 号查找进程名称?

在Linux的复杂世界中,进程是系统运行的核心,每个进程都由一个唯一的「进程ID」(PID)标识。无论是系统管理员在排查失控进程,还是开发者在调试应用程序,知道如何将PID映射到对应的进程名称都是一项...

Linux服务器硬件信息查询与日常运维命令总结

1.服务器硬件信息查询1.1CPU信息查询命令功能描述示例lscpu显示CPU架构、核心数、线程数等lscpucat/proc/cpuinfo详细CPU信息(型号、缓存、频率)cat/proc/c...

Ubuntu 操作系统常用命令详解(ubuntu常用的50个命令)

UbuntuLinux是一款流行的开源操作系统,广泛应用于服务器、开发、学习等场景。命令行是Ubuntu的灵魂,也是高效、稳定管理系统的利器。本文按照各大常用领域,详细总结Ubuntu必学...

从 0 到 1:打造基于 Linux 的私有 API 网关平台

在当今微服务架构盛行的时代,API网关作为服务入口和安全屏障,其重要性日益凸显。你是否想过,不依赖商业方案,完全基于开源组件,在Linux上构建一个属于自己的私有API网关平台?今天就带你...

Nginx搭建简单直播服务器(nginx 直播服务器搭建)

前言使用Nginx+Nginx-rtmp-module在Ubuntu中搭建简单的rtmp推流直播服务器。服务器环境Ubuntu16.04相关概念RTMP:RTMP协议是RealTi...

Linux连不上网?远程卡?这篇网络管理指南你不能错过!

大家好!今天咱们聊个所有Linux用户都躲不开的“老大难”——网络管理。我猜你肯定遇到过这些崩溃时刻:新装的Linux系统连不上Wi-Fi,急得直拍桌子;远程服务器SSH连不上,提示“Connecti...

7天从0到上线!手把手教你用Python Flask打造爆款Web服务

一、为什么全网开发者都在疯学Flask?在当今Web开发的战场,Flask就像一把“瑞士军刀”——轻量级架构让新手3天速成,灵活扩展能力又能支撑百万级用户项目!对比Django的“重型装甲”,Flas...

nginx配置文件详解(nginx反向代理配置详解)

Nginx是一个强大的免费开源的HTTP服务器和反向代理服务器。在Web开发项目中,nginx常用作为静态文件服务器处理静态文件,并负责将动态请求转发至应用服务器(如Django,Flask,et...

30 分钟搞定 Docker 安装与 Nginx 部署,轻松搭建高效 Web 服务

在云计算时代,利用容器技术快速部署应用已成为开发者必备技能。本文将手把手教你在阿里云轻量应用服务器上,通过Docker高效部署Nginx并发布静态网站,全程可视化操作,新手也能轻松上手!一、准...

Nginx 配置实战:从摸鱼到部署,手把手教你搞定生产级配置

各位摸鱼搭子们!今天咱不聊代码里的NullPointerException,改聊点「摸鱼必备生存技能」——Nginx配置!先灵魂拷问一下:写了一堆接口却不会部署?服务器被恶意请求打崩过?静态资源加载...

如何使用 Daphne + Nginx + supervisor部署 Django

前言:从Django3.0开始支持ASGI应用程序运行,使Django完全具有异步功能。Django目前已经更新到5.0,对异步支持也越来越好。但是,异步功能将仅对在ASGI下运行的应用程序可用...

Docker命令最全详解(39个最常用命令)

Docker是云原生的核心,也是大厂的必备技能,下面我就全面来详解Docker核心命令@mikechen本文作者:陈睿|mikechen文章来源:mikechen.cc一、Docker基本命令doc...

ubuntu中如何查看是否已经安装了nginx

在Ubuntu系统中,可以通过以下几种方法检查是否已安装Nginx:方法1:使用dpkg命令(适用于Debian/Ubuntu)bashdpkg-l|grepnginx输出...

OVN 概念与实践(德育概念的泛化在理论和实践中有什么弊端?)

今天我们来讲解OVN的概念和基础实践,要理解本篇博客的内容,需要前置学习:Linux网络设备-Bridge&VethPairLinux网络设备-Bridge详解OVS+Fa...

取消回复欢迎 发表评论: