ULID和UUID在Postgres数据库中的性能
nanshan 2024-11-14 16:38 25 浏览 0 评论
更多编程技术文章,请查阅IOKKS - 专业编程技术分享平台
我将使用PostgreSQL数据库和演示Java服务来比较查询速度。
UUID和ULID
为什么我们需要一些难以理解的ID类型?我不会谈论分布式系统、服务的连接性、敏感数据等等。如果有人对此感兴趣,可以自行搜索 - 目前我们感兴趣的是性能。正如其名称所示,我们将讨论两种类型的键:UUID和ULID。
UUID早已为人所知,但ULID对一些人来说可能不太熟悉。ULID的主要优势在于它是单调递增的,是一种可排序的类型。当然,这些并不是所有的区别。就我个人而言,我也喜欢它没有特殊字符这一事实。
一个小插曲,我很久以前就注意到许多团队在PostgreSQL数据库中使用varchar(36)数据类型来存储UUID,我不喜欢这样,因为这个数据库有相应的UUID数据类型。稍后,我们将看到在数据库端存储UUID的不同格式时,哪种类型更可取。因此,我们将不仅比较后端的两种数据类型,还将比较在不同格式下存储UUID时的差异。
比较
让我们开始比较这些事情。
- UUID有36个字符长,占用128位内存。
- ULID有26个字符长,同样占用128位内存。
对于我的示例,我在数据库中创建了两个表,每个表有三个字段:
CREATE TABLE test.speed_ulid
(
id varchar(26) PRIMARY KEY,
name varchar(50),
created timestamp
);
CREATE TABLE test.speed_uuid
(
id varchar(36) PRIMARY KEY,
name varchar(50),
created timestamp
);
对于第一次比较,我以通常的方式将UUID存储为varchar(36)格式。在数据库中,我在每个表中记录了1,000,000条数据。
测试用例将包括100个请求,使用先前从数据库中提取的标识符;也就是说,在调用测试方法时,我们将100次访问数据库并通过键检索实体。在测量之前,将创建并预热连接。我们将进行两次测试运行,然后进行10次有效迭代。为了您的方便,我将在文章末尾提供Java代码的链接。
抱歉,但是这些测量是在标准的MacBook Pro笔记本电脑上进行的,而不是在专用服务器上进行的,但我相信除了在数据库和后端之间的网络流量增加之外,结果不会有显著的差异。
以下是一些背景信息:
- # CPU I9-9980HK
- # CPU核数:16
- # RAM:32GB
- # JMH版本:1.37
- # VM版本:JDK 11.0.12, Java HotSpot(TM) 64位服务器VM, 11.0.12+8-LTS-237
- # DB: PostgreSQL 13.4, build 1914, 64位
将用于通过键获取实体的查询:
SELECT * FROM test.speed_ulid where id = ?
SELECT * FROM test.speed_uuid where id = ?
测量结果
让我们来看看测量结果。请记住,每个表都有1,000,000行数据。
两种类型的标识符都以varchar形式存储在数据库中
我进行了几次测试,结果大致相同:ULID要么稍快,要么UUID稍快。从百分比来看,差异几乎为零。
好吧,你可能会不同意这两种类型之间没有差异。我会说,在数据库端使用其他数据类型是不可能的。
UUID作为数据库中的uuid,ULID作为varchar
对于下一个测试,我将test.speed_uuid 表中的数据类型从varchar(36)更改为uuid。
在这种情况下,差异是明显的:UUID比ULID快4.5%。
正如你所看到的,如果在服务端有相同名称的类型,那么在数据库端使用uuid数据类型是有意义的。这种格式的索引在PostgreSQL中经过了很好的优化,并显示出良好的结果。
好吧,现在我们可以明确地分道扬镳了。还是吗?
如果你查看索引搜索查询计划,你会看到在使用varchar时是这样的((id)::text = '01HEE5PD6HPWMBNF7ZZRF8CD9R'::text)。
总的来说,比较两个文本变量是一个相当慢的操作,所以也许没有必要以这种格式存储ID。或者是否有其他方法可以加快键的比较速度?首先,让我们为具有ULID的表创建另一个“hash”类型的索引。
create index speed_ulid_id_index
on test.speed_ulid using hash (id);
让我们看看我们查询的执行计划:
我们将看到数据库在这种情况下使用了哈希索引,而不是btree。让我们运行我们的测试,看看会发生什么。
varchar + index(hash) for ULID, uuid for UUID
这种组合相对于uuid及其欺骗性索引增加了2.3%。
我不确定在一个字段上保留两个索引是否有道理。因此,值得考虑是否还有其他事情可以做。在这里,值得回顾一下过去,记得以前是如何存储uuid或其他字符串标识符的。没错:要么文本,要么字节数组。
所以让我们尝试这个选项:我删除了ULID的所有索引,将其转换为bytea,并重新创建了主键。
bytea for ULID, uuid for UUID
结果,我们得到了与上一次运行中额外索引的结果大致相同,但我个人更喜欢这个选项。
在数据库中有2,000,000行数据时的测量结果:
在数据库中有3,000,000行数据时的测量结果:
我认为没有继续进行更多的测量的必要。模式保持不变:以bytea格式保存的ULID在数据库中略优于以uuid格式保存的UUID。
如果我们从第一次测量中获取数据,显然,通过一些小的操作,你可以将性能提高约9%,如果使用varchar。
因此,如果你读到这里,我认为这篇文章对你来说是有趣的,你已经为自己得出了一些结论。
值得注意的是,测量是在后端部分和数据库端都处于理想状态下进行的。我们没有任何并行进程在数据库中写入数据,更改记录,或在后端进行复杂的计算。
结论
让我们回顾一下材料。你学到了什么有用的东西?
- 不要忽视PostgreSQL端的uuid数据类型。也许有一天在这个数据库中会出现ULID的扩展,但目前我们只能使用现有的。
- 有时手动创建所需类型的额外索引是值得的,但需要考虑开销。
- 如果你不怕做一些不必要的工作 - 即编写自己的类型转换器 - 那么如果在数据库端没有相应的类型,你应该尝试bytea。
对于主键应该使用什么类型的数据,以及应该以什么格式存储,我没有明确的答案:这一切都取决于许多因素。值得注意的是,对于ID的数据类型的明智选择,在某个时刻可能会在你的项目中发挥重要作用。
相关推荐
- 使用nginx配置域名及禁止直接通过IP访问网站
-
前段时间刚搭建好这个网站,一直没有关注一个问题,那就是IP地址也可以访问我的网站,今天就专门研究了一下nginx配置问题,争取把这个问题研究透彻。1.nginx配置域名及禁止直接通过IP访问先来看n...
- 如何在 Linux 中使用 PID 号查找进程名称?
-
在Linux的复杂世界中,进程是系统运行的核心,每个进程都由一个唯一的「进程ID」(PID)标识。无论是系统管理员在排查失控进程,还是开发者在调试应用程序,知道如何将PID映射到对应的进程名称都是一项...
- Linux服务器硬件信息查询与日常运维命令总结
-
1.服务器硬件信息查询1.1CPU信息查询命令功能描述示例lscpu显示CPU架构、核心数、线程数等lscpucat/proc/cpuinfo详细CPU信息(型号、缓存、频率)cat/proc/c...
- Ubuntu 操作系统常用命令详解(ubuntu常用的50个命令)
-
UbuntuLinux是一款流行的开源操作系统,广泛应用于服务器、开发、学习等场景。命令行是Ubuntu的灵魂,也是高效、稳定管理系统的利器。本文按照各大常用领域,详细总结Ubuntu必学...
- 从 0 到 1:打造基于 Linux 的私有 API 网关平台
-
在当今微服务架构盛行的时代,API网关作为服务入口和安全屏障,其重要性日益凸显。你是否想过,不依赖商业方案,完全基于开源组件,在Linux上构建一个属于自己的私有API网关平台?今天就带你...
- Nginx搭建简单直播服务器(nginx 直播服务器搭建)
-
前言使用Nginx+Nginx-rtmp-module在Ubuntu中搭建简单的rtmp推流直播服务器。服务器环境Ubuntu16.04相关概念RTMP:RTMP协议是RealTi...
- Linux连不上网?远程卡?这篇网络管理指南你不能错过!
-
大家好!今天咱们聊个所有Linux用户都躲不开的“老大难”——网络管理。我猜你肯定遇到过这些崩溃时刻:新装的Linux系统连不上Wi-Fi,急得直拍桌子;远程服务器SSH连不上,提示“Connecti...
- 7天从0到上线!手把手教你用Python Flask打造爆款Web服务
-
一、为什么全网开发者都在疯学Flask?在当今Web开发的战场,Flask就像一把“瑞士军刀”——轻量级架构让新手3天速成,灵活扩展能力又能支撑百万级用户项目!对比Django的“重型装甲”,Flas...
- nginx配置文件详解(nginx反向代理配置详解)
-
Nginx是一个强大的免费开源的HTTP服务器和反向代理服务器。在Web开发项目中,nginx常用作为静态文件服务器处理静态文件,并负责将动态请求转发至应用服务器(如Django,Flask,et...
- 30 分钟搞定 Docker 安装与 Nginx 部署,轻松搭建高效 Web 服务
-
在云计算时代,利用容器技术快速部署应用已成为开发者必备技能。本文将手把手教你在阿里云轻量应用服务器上,通过Docker高效部署Nginx并发布静态网站,全程可视化操作,新手也能轻松上手!一、准...
- Nginx 配置实战:从摸鱼到部署,手把手教你搞定生产级配置
-
各位摸鱼搭子们!今天咱不聊代码里的NullPointerException,改聊点「摸鱼必备生存技能」——Nginx配置!先灵魂拷问一下:写了一堆接口却不会部署?服务器被恶意请求打崩过?静态资源加载...
- 如何使用 Daphne + Nginx + supervisor部署 Django
-
前言:从Django3.0开始支持ASGI应用程序运行,使Django完全具有异步功能。Django目前已经更新到5.0,对异步支持也越来越好。但是,异步功能将仅对在ASGI下运行的应用程序可用...
- Docker命令最全详解(39个最常用命令)
-
Docker是云原生的核心,也是大厂的必备技能,下面我就全面来详解Docker核心命令@mikechen本文作者:陈睿|mikechen文章来源:mikechen.cc一、Docker基本命令doc...
- ubuntu中如何查看是否已经安装了nginx
-
在Ubuntu系统中,可以通过以下几种方法检查是否已安装Nginx:方法1:使用dpkg命令(适用于Debian/Ubuntu)bashdpkg-l|grepnginx输出...
- OVN 概念与实践(德育概念的泛化在理论和实践中有什么弊端?)
-
今天我们来讲解OVN的概念和基础实践,要理解本篇博客的内容,需要前置学习:Linux网络设备-Bridge&VethPairLinux网络设备-Bridge详解OVS+Fa...
你 发表评论:
欢迎- 一周热门
-
-
UOS服务器操作系统防火墙设置(uos20关闭防火墙)
-
极空间如何无损移机,新Z4 Pro又有哪些升级?极空间Z4 Pro深度体验
-
手机如何设置与显示准确时间的详细指南
-
NAS:DS video/DS file/DS photo等群晖移动端APP远程访问的教程
-
如何在安装前及安装后修改黑群晖的Mac地址和Sn系列号
-
如何修复用户配置文件服务在 WINDOWS 上登录失败的问题
-
一加手机与电脑互传文件的便捷方法FileDash
-
日本海上自卫队的军衔制度(日本海上自卫队的军衔制度是什么)
-
10个免费文件中转服务站,分享文件简单方便,你知道几个?
-
爱折腾的特斯拉车主必看!手把手教你TESLAMATE的备份和恢复
-
- 最近发表
-
- 使用nginx配置域名及禁止直接通过IP访问网站
- 如何在 Linux 中使用 PID 号查找进程名称?
- Linux服务器硬件信息查询与日常运维命令总结
- Ubuntu 操作系统常用命令详解(ubuntu常用的50个命令)
- 从 0 到 1:打造基于 Linux 的私有 API 网关平台
- Nginx搭建简单直播服务器(nginx 直播服务器搭建)
- Linux连不上网?远程卡?这篇网络管理指南你不能错过!
- 7天从0到上线!手把手教你用Python Flask打造爆款Web服务
- nginx配置文件详解(nginx反向代理配置详解)
- 30 分钟搞定 Docker 安装与 Nginx 部署,轻松搭建高效 Web 服务
- 标签列表
-
- linux 查询端口号 (58)
- docker映射容器目录到宿主机 (66)
- 杀端口 (60)
- yum更换阿里源 (62)
- internet explorer 增强的安全配置已启用 (65)
- linux自动挂载 (56)
- 禁用selinux (55)
- sysv-rc-conf (69)
- ubuntu防火墙状态查看 (64)
- windows server 2022激活密钥 (56)
- 无法与服务器建立安全连接是什么意思 (74)
- 443/80端口被占用怎么解决 (56)
- ping无法访问目标主机怎么解决 (58)
- fdatasync (59)
- 405 not allowed (56)
- 免备案虚拟主机zxhost (55)
- linux根据pid查看进程 (60)
- dhcp工具 (62)
- mysql 1045 (57)
- 宝塔远程工具 (56)
- ssh服务器拒绝了密码 请再试一次 (56)
- ubuntu卸载docker (56)
- linux查看nginx状态 (63)
- tomcat 乱码 (76)
- 2008r2激活序列号 (65)