百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

Linux查看文件大小:`ls`和`du`为何结果不同?一文讲透原理!

nanshan 2025-05-05 17:45 20 浏览 0 评论

Linux查看文件大小:ls和du为何结果不同?一文讲透原理!

在Linux运维中,查看文件大小是日常高频操作。但你是否遇到过以下困惑?


ls看到文件是1GB,用du却显示只有20MB?为什么会有这种差异?本文从底层原理到实战场景,带你彻底理解两者的区别!


一、核心差异:逻辑大小 vs 物理占用

1. ls显示逻辑大小
ls -l展示的是文件内容的实际字节数,即文件创建时写入的数据总量。例如:

$ ls -lh large_file.txt
-rw-r--r-- 1 user 1.2G Apr 8 10:00 large_file.txt

这里的1.2G表示文件内容总大小,无论是否包含空洞或零数据。


2. du显示物理占用
du -h统计的是文件在磁盘上实际占用的空间,受文件系统块大小影响。例如:

$ du -h large_file.txt
20M    large_file.txt

即使文件只有1字节,也会占用至少1个块(默认4KB)的空间。


二、三大关键原因解析

1. 文件系统块机制
o
块大小决定最小单位:Linux文件系统以块(通常4KB)为单位分配空间。
o
计算公式磁盘占用 = ceil(文件大小 / 块大小) × 块大小
例如:13KB文件占用4个块 → 16KB空间。


2. 稀疏文件(Sparse File)
稀疏文件通过"空洞"技术节省空间,表现为:
o
ls显示逻辑总大小
o du仅统计实际写入的数据块

# 创建1GB稀疏文件(实际占用200MB)
dd if=/dev/zero of=sparse.img bs=1M seek=1024 count=0
ls -lh sparse.img  # 显示1.0G
du -h sparse.img   # 显示200M

3. 目录统计规则
o
ls仅显示目录元数据大小(通常4KB)
o du递归统计目录内所有文件大小

$ mkdir test_dir
$ touch test_dir/file{1..100}  # 创建100个空文件
$ ls -ld test_dir            # 显示4.0K
$ du -sh test_dir            # 显示约400K(100个文件×4KB块)

三、实战场景分析

场景1:日志文件异常增长

# 发现日志文件显示10GB,但磁盘空间只占用2GB
ls -lh app.log      # 10G
du -h app.log       # 2G

# 原因:日志文件被清空但进程未释放(需重启服务)
lsof | grep deleted  # 查看被删除但仍被占用的文件

场景2:备份文件体积差异

# 原始文件10GB,压缩后生成backup.tar.gz
ls -lh backup.tar.gz  # 显示9.8G
du -h backup.tar.gz   # 显示2.1G(压缩+块分配)

四、进阶技巧

1. 查看真实磁盘占用

# 统计目录总大小(含子目录)
du -sh /var/log

# 按大小排序(快速定位大文件)
du -ah / | sort -rh | head -n 20

2. 处理稀疏文件

# 复制时保留稀疏特性
cp --sparse=always large.img backup.img

3. 权限问题排查

# 无权限文件导致统计异常
sudo du -sh /protected_dir

五、总结对比表

特性

ls命令

du命令

统计对象

文件逻辑大小

磁盘物理占用空间

单位

字节(可转人类可读格式)

块大小(默认4KB)

目录处理

仅显示目录元数据大小

递归统计所有子文件和目录

稀疏文件

显示总大小

显示实际占用空间


运维小贴士
o 日常监控用
du了解真实存储消耗
o 文件传输时用ls确认内容完整性
o 疑似空间泄漏时结合lsof排查

下次遇到文件大小差异,你一定能快速定位原因!如果觉得有用,欢迎转发给更多运维小伙伴~

相关推荐

Linux 的磁盘系统,和你了解的Windows差别很大

我的C盘去哪了?一个系统,如果没有存储,那么也就不能称之为系统。存储性是一个完整系统的重要组成部分。例如AWS最开始的服务就是S3(用来存储数据的云服务),足以见得存储对于一个应用平台是多么的重要。...

一文读懂 Linux 硬盘挂载:从问题到解决方案

各位互联网大厂的后端开发伙伴们!在咱们日常工作中,操作Linux系统是常有的事儿吧。你们有没有遇到过这样的场景:新添加了一块硬盘,满心欢喜准备用来存储重要数据或者部署新的应用服务,却突然发现不知道...

硬盘分区(硬盘分区格式)

 磁盘(硬盘)分区,可以分C、D、E等分区,大家可能都会用,会根据自已的需要确定所需的空间,但分区是如何工作的呢,内容如下。Windows中有3类:MBR分区:MasterBootRecord,也...

parted命令工具分区介绍(particle命令)

linux系统磁盘分区通常可以使用fdisk和parted命令,当分区大小小于2TB的时候,两种皆可以使用,当分区大于2TB的话,就需要用parted分区。以下介绍parted命令相关使用,以sdb为...

Linux 服务器上查看磁盘类型的方法

方法1:使用lsblk命令lsblk输出说明:TYPE列显示设备类型,如disk(物理磁盘)、part(分区)、rom(只读存储)等。NAME列显示设备名称(如sda、nvme0n1)。TR...

Linux分区命令fdisk和parted使用介绍

摘要:一般情况下,Linux分区都是选择fdisk工具,要求硬盘格式为MBR格式,能支持的最大分区空间为2T。但是目前在实际生产环境中使用的磁盘空间越来越大,呈TB级别增长;而常用的fdisk这个工具...

linux 分区原理与名词解释(linux操作系统中的分区类型)

分区的意义将磁盘分成几份,每份挂在到文件系统的那个目录在linux里的文件系统Ext2:早期的格式,不支持日志功能Ext3:ext2改良版,增加了日志功能,是最基本且最常用的使用格式了Ext4:针对e...

linux 分区合并(linux合理分区)

查看虚拟机当前磁盘挂载情况fdisk-l选择磁盘fdisk/dev/sda查看磁盘分区情况p重新选择分区n选择主分区p保存w创建物理卷pvcreate/dev/sda3查看物理卷信息pvdi...

如何在 Linux 系统中永久禁用交换分区 ?

Linux操作系统中的交换分区或交换文件充当硬盘上的临时存储区域,当物理内存(RAM)满时,系统使用该存储区域。它用于交换较少使用的内存页,这样系统就不会因为运行应用程序而耗尽物理内存。随着技术的发...

Linux 如何知道硬盘已用多少空间、未用多少空间

刚出社会时,去了一家公司上班,老板为了省钱,买的服务器是低配的,硬盘大小只有40G,有一次网站突然不能访问了,排查半天才知道原来服务器的硬盘空间已用完,已无可用空间。第一步是查看硬盘的使用情况,第二步...

用Linux系统管理磁盘空间 就该这么来

要想充分有效的管理使用Linux系统中的存储空间,用户必须要做的就是双管齐下,一边扩充空间一边限制空间。不得不说的就是很多时候磁盘空间就像水资源,需节制水流。说到要如何实现限制空间就离不开使用LVM技...

Windows 11 磁盘怎么分区?(windows11磁盘怎么分区)

Windows11磁盘分区技术解析与操作指南:构建高效存储体系一、磁盘分区的技术本质与系统价值磁盘分区作为存储系统的基础架构,通过逻辑划分实现数据隔离与管理优化。Windows11采用NTF...

linux上创建多个文件分区,格式化为 ext2、ext3、ext4、XFS 文件

以下是在Linux系统上创建多个20GB文件分区并格式化为不同文件系统的分步指南:步骤1:创建基础文件(4个20GB文件)bash#创建4个20GB稀疏文件(实际占用空间随写入量增长)ddif=/...

救命的U盘低格哪家最强?(低格优盘)

周二时有位童鞋留言说U盘之前做过引导盘,现在格式化不了,用各种工具都不行,而且因为U盘厂商的关系,查不到U盘主控,无法量产恢复,特来求助。小编花了点时间特意弄坏一个U盘分区,终于试出方法了,特来分享一...

Linux 查看硬件磁盘存储大小和磁盘阵列(RAID)的组合方式

一、查看硬件磁盘存储大小查看所有磁盘信息:#lsblk该命令会列出所有磁盘(如/dev/sda、/dev/nvme0n1)及其分区和挂载点。查看磁盘总容量:fdisk-l#或parted-...

取消回复欢迎 发表评论: