盘点只读压缩文件系统
nanshan 2024-12-10 18:54 8 浏览 0 评论
为什么需要只读压缩文件系统?
在存储容量有限的嵌入式设备上,一般对于系统分区在使用过程中没有数据写入需求,同时希望可以节省存储空间——只读压缩文件系统应运而生。另外,只读压缩文件系统也可用于归档文件。相比tar,zip等压缩软件,只读压缩文件系统的性能和灵活性都更好。Linux早期的只读文件系统有CramFS和SquashFS,以及参考了上述两个文件系统设计的用户态只读压缩文件系统CromFS。另外,最近两年在Android平台上实现商用的EROFS也值得关注。EROFS针对手机使用场景,对读放大和内存占用过多从设计理念上带来了一些新的优化。
CramFS,SquashFS,CromFS横评
CramFS被设计成用于存储空间很小的嵌入式设备上,倾向于极致简单、极其节省空间。在使用上存在诸多限制,如:单个文件大小不能超过16MB、文件系统大小略大于256MB(最后一个文件允许超过256MB空间范围,即文件系统总大小不超过272MB)。CramFS的gid只保存8位,mkcramfs会简单的将gid截断保留最后8位(有一些安全风险)。CramFS支持硬链接,但是被硬链接的文件引用计数不会增加。CramFS文件没有时间戳,所有文件的创建/访问时间戳都是1970年1月1日 0:00:00 GMT。(最近访问过的文件可能会被更新时间戳,但只在内存中保存。)CramFS的镜像只支持被同样字节对齐方式的机器创建和挂载使用,页面大小只支持4KB。
SquashFS的出现替代了CramFS,但CramFS通过支持XIP(Execution In Place)有了新的用武之地。SquashFS设计上相比CramFS去掉了大部分限制因素:其会保存完整的uid/gid(32位)、文件创建时间,单文件最大支持16 EB,文件系统最大大小也是16 EB。压缩后的inode平均消耗8字节,根据文件类型不同(文件、目录、符号链接等)inode大小有所变化。对于压缩文件系统,压缩输入的数据块大小(chunk size)决定了压缩率收益和潜在的读放大开销。SquashFS 2.x版本的chunk size最大为64KB, SquashFS 3.x版本的chunk size最大可达1MB。SquashFS 3.x版本默认的chunk size是128KB,相比4KB大小的chunk size压缩率有明显提升。SquashFS还支持fragment block,即多个小文件存入一个block,极大的提升了压缩率。SquashFS支持大端和小端对齐方式,可以在不同的字节序机器上创建和挂载。
CromFS的主要设计目标是高压缩率,性能和内存使用量不是它关心的方面。CromFS是一个用户态文件系统,通过块级别去冗和高压缩率算法实现压缩收益最大化。同CramFS和SquashFS的详细特性对比如下表:
EROFS带来哪些新变化?
EROFS的全称是Enhanced Read-Only File System,相比前述只读压缩文件系统最大的不同是压缩思路和解压方式的改变。不同于以往固定输入长度(Fixed Sized Input)的压缩形式,EROFS采用固定输出长度(Fixed Sized Output)的压缩思路。这解决了固定输入长度的压缩带来的读放大问题,4KB的固定输出长度压缩就可达到128KB的固定输入长度压缩的压缩率。对于SquashFS来说,达到同样的压缩收益可能需要比EROFS多读几倍的数据块。另外,SquashFS在运行时内存使用方面也远远多于EROFS的原地解压策略,这在系统处于低内存状态时会导致读性能大幅下降。为了更好的解压速度同时保证一定的压缩率,EROFS使用的压缩算法为LZ4。默认压缩输出块大小为4KB,其他特性支持上均对标SquashFS。这里不再一一赘述。
定长输出和定长输入的示意如下图所示,EROFS会通过多次尝试不同长度的输入数据将其压缩到固定大小(4KB)的输出块上,SquashFS则是根据预先配置好的输入长度(Chunk Size)压缩数据并写到输出块上(可能跨多个数据块)。当EROFS的固定输出长度设为存储设备的块大小(如:4KB)时,可以认为没有读放大。因为无论要读的内容是哪一部分以及大小,对于块设备来说都至少要读取一个数据块。
在内存分配上,EROFS根据上层希望读取的内容是否需要将盘上读出数据全部解压会选择不同的策略。对于需全部解压的情况,EROFS会使用VFS已分配的Page Cache内存页,这样节省了内存的占用;对于需部分解压的情况,EROFS则会独立分配缓存页以便后续读取相同压缩块时避免产生新的I/O。当压缩数据块已被读入内存后,以下图中读取数据块3,4为例,EROFS的基本数据解压方式大致步骤如下:
- 根据上层要读取范围计算要解压的数据块(这个例子中是0,1,2,3,4)
- 分配临时缓存页(可选)存放解压内容(0,1,2),VFS已分配数据页不用再分配
- 通过vmap将上述物理页映射为连续虚拟页
- 如果有原地I/O占用了VFS分配的数据页,则将数据拷贝到临时页
- 解压数据到指定虚拟地址
为优化内存占用,EROFS还提供了缓存解压/滚动解压(预分配一定数量的内存页)、原地解压等策略。另外,通过调度优化和协同解压进一步改善了数据读取性能。理论上,解压的过程增加了CPU计算时间,而压缩数据读取减少了I/O时间(特别是对于顺序读取来说)。所以对于只读压缩文件来说,压缩率达到一定收益后读性能会好于不压缩的文件系统。即CPU时间的增加小于I/O时间的减少,这从EROFS的测试数据也可以看出:当压缩节省空间超过35%以上时,随压缩比提升EROFS的读性能(特别是顺序读)会越来越好于EXT4。
以上就是对只读压缩文件系统的一个简单介绍,可以看出根据应用场景的不同各个只读压缩文件系统在压缩比、压缩/解压效率上各有侧重。EROFS相比其他只读压缩文件系统引入了更多的设计思路,实现细节和一些优化值得肯定。
相关推荐
- Let’s Encrypt免费搭建HTTPS网站
-
HTTPS(全称:HyperTextTransferProtocoloverSecureSocketLayer),是以安全为目标的HTTP通道,简单讲是HTTP的安全版。即HTTP下加入...
- 使用Nginx配置TCP负载均衡(nginx tcp负载)
-
假设Kubernetes集群已经配置好,我们将基于CentOS为Nginx创建一个虚拟机。以下是实验种设置的详细信息:Nginx(CenOS8Minimal)-192.168.1.50Kube...
- Nginx负载均衡及支持HTTPS与申请免费SSL证书
-
背景有两台minio文件服务器已做好集群配置,一台是192.168.56.41:9000;另一台是192.168.56.42:9000。应用程序通过Nginx负载均衡调用这两台minio服务,减轻单点...
- HTTPS配置实战(https配置文件)
-
原因现在网站使用HTTPS是规范操作之一,前些日子买了腾讯云服务,同时申请了域名http://www.asap2me.top/,目前该域名只支持HTTP,想升级为HTTPS。关于HTTPS的链接过程大...
- 只有IP地址没有域名实现HTTPS访问方法
-
一般来说,要实现HTTPS,得有个注册好的域名才行。但有时候呢,咱只有服务器的IP地址,没注册域名,这种特殊情况下,也能照样实现HTTPS安全访问,按下面这些步骤来就行:第一步,先确认公网...
- 超详解:HTTPS及配置Django+HTTPS开发环境
-
众所周知HTTP协议是以TCP协议为基石诞生的一个用于传输Web内容的一个网络协议,在“网络分层模型”中属于“应用层协议”的一种。在这里我们并不研究该协议标准本身,而是从安全角度去探究使用该协议传输数...
- Godaddy购买SSL之后Nginx配置流程以及各种错误的解决
-
完整流程:参考地址:https://sg.godaddy.com/zh/help/nginx-generate-csrs-certificate-signing-requests-3601生成NGI...
- Nginx从安装到高可用,一篇搞定(nginx安装与配置详解)
-
一、Nginx安装1、去官网http://nginx.org/下载对应的nginx包,推荐使用稳定版本2、上传nginx到linux系统3、安装依赖环境(1)安装gcc环境yuminstallgc...
- 阿里云免费证书申请,配置安装,使用tomcat,支持http/https访问
-
参数说明商品类型默认已选择云盾证书服务(无需修改)。云盾证书服务类型SSL证书服务的类型。默认已选择云盾SSL证书(无需修改),表示付费版SSL证书。如果您需要免费领取或付费扩容DV单域名证书【免费试...
- 你试过两步实现Nginx的规范配置吗?极速生成Nginx配置小工具
-
NGINX是一款轻量级的Web服务器,最强大的功能之一是能够有效地提供HTML和媒体文件等静态内容。NGINX使用异步事件驱动模型,在负载下提供可预测的性能。是当下最受欢迎的高性能的Web...
- 从零开始搭建HTTPS服务(搭建https网站)
-
搭建HTTPS服务的最初目的是为了开发微信小程序,因为wx.request只允许发起HTTPS请求,并且还必须和指定的域名进行网络通信。要从零开始搭建一个HTTPS的服务需要下面4...
- 群晖NAS使用官网域名和自己的域名配置SSL实现HTTPS访问
-
安全第一步,群晖NAS使用官网域名和自己的域名配置SSL实现HTTPS访问【新手导向】NAS本质还是一个可以随时随地访问的个人数据存储中心,我们在外网访问的时候,特别是在公网IP下,其实会面临着很多安...
- 让网站快速升级HTTPS协议提高安全性
-
为什么用HTTPS网络安全越来越受到重视,很多互联网服务网站,都已经升级改造为https协议。https协议下数据包是ssl/tcl加密的,而http包是明文传输。如果请求一旦被拦截,数据就会泄露产生...
- 用Https方式访问Harbor-1.9版本(https访问流程)
-
我上周在头条号写过一篇原创文章《Docker-Harbor&Docker-kitematic史上最详细双系统配置手册》,这篇算是它的姊妹篇吧。这篇文章也将用到我在头条写的另一篇原创文章的...
- 如何启用 HTTPS 并配置免费的 SSL 证书
-
在Linux服务器上启用HTTPS并配置免费的SSL证书(以Let'sEncrypt为例)可以通过以下步骤完成:---###**一、准备工作**1.**确保域名已解析**...
你 发表评论:
欢迎- 一周热门
-
-
极空间如何无损移机,新Z4 Pro又有哪些升级?极空间Z4 Pro深度体验
-
如何在安装前及安装后修改黑群晖的Mac地址和Sn系列号
-
爱折腾的特斯拉车主必看!手把手教你TESLAMATE的备份和恢复
-
10个免费文件中转服务站,分享文件简单方便,你知道几个?
-
[常用工具] OpenCV_contrib库在windows下编译使用指南
-
日本海上自卫队的军衔制度(日本海上自卫队的军衔制度是什么)
-
【系统配置】信创终端挂载NAS共享全攻略:一步到位!
-
UOS服务器操作系统防火墙设置(uos20关闭防火墙)
-
Ubuntu系统Daphne + Nginx + supervisor部署Django项目
-
WindowsServer2022|配置NTP服务器的命令
-
- 最近发表
- 标签列表
-
- linux 查询端口号 (58)
- docker映射容器目录到宿主机 (66)
- 杀端口 (60)
- yum更换阿里源 (62)
- internet explorer 增强的安全配置已启用 (65)
- linux自动挂载 (56)
- 禁用selinux (55)
- sysv-rc-conf (69)
- ubuntu防火墙状态查看 (64)
- windows server 2022激活密钥 (56)
- 无法与服务器建立安全连接是什么意思 (74)
- 443/80端口被占用怎么解决 (56)
- ping无法访问目标主机怎么解决 (58)
- fdatasync (59)
- 405 not allowed (56)
- 免备案虚拟主机zxhost (55)
- linux根据pid查看进程 (60)
- dhcp工具 (62)
- mysql 1045 (57)
- 宝塔远程工具 (56)
- ssh服务器拒绝了密码 请再试一次 (56)
- ubuntu卸载docker (56)
- linux查看nginx状态 (63)
- tomcat 乱码 (76)
- 2008r2激活序列号 (65)