百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

如何在 Linux 中查找最大的文件?(linux查询最大的文件)

nanshan 2025-05-05 17:45 6 浏览 0 评论

在某个深夜的紧急维护中,当您发现根目录剩余空间不足1%时;在持续构建失败却找不到原因时;当服务器响应速度突然变慢时——找到那些吞噬磁盘空间的"元凶文件"往往是解决问题的第一步。

某电商平台数据库服务器突发IO阻塞,经排查发现是某个PHP进程持续写入的10GB错误日志文件。运维团队使用du -sh *逐层查找耗时27分钟,而使用本文介绍的组合命令仅需8秒即可锁定目标。

  • 跨多级目录快速检索
  • 排除特定文件类型干扰
  • 精准识别隐藏的分散大文件
  • 处理特殊字符文件名

du命令

查看当前目录各子目录大小(人类可读格式)

du -h --max-depth=1 | sort -hr 

查找前10大目录(排除挂载点)

du -xh / 2>/dev/null | sort -rh | head -n 10 

进阶技巧:筛选大于500MB的目录

du -h --threshold=3M /etc 2>/dev/null 

关键参数

  • -x 防止跨越文件系统边界
  • --apparent-size 显示文件表面大小而非磁盘占用
  • --time 显示最后修改时间

find命令

查找/etc下大于1M的文件(精确到字节)

find /etc -type f -size +1048576 -exec ls -lh {} \; 2>/dev/null 

按时间维度搜索(最近30天修改过的500MB+文件)

find /var -mtime -30 -size +500M -printf "%s\t%p\n" | sort -n 

高级格式输出

使用-printf自定义输出格式:
%Tk 最后修改时间(k替换为@=秒数,+=可读格式)
%U 属主名称
%b 占用磁盘块数

ls与排序结合

按文件大小逆序显示前20项(含隐藏文件)

ls -AlhS --group-directories-first | head -n 20 

显示inode使用情况(排查大量小文件问题)

ls -i | sort -n | tail -n 15 

sort命令

按第5列(大小)数字逆序排序

du -h /etc | sort -k5 -hr 

混合排序:优先目录后文件,按大小降序

find . -type d -exec du -s {} \; 2>/dev/null | sort -n | cut -f2 | xargs du -sh 

非常规场景

稀疏文件检测

查找实际占用小于表面大小的文件

find . -type f -printf "%S\t%p\n" | awk '$1 < 1.0' 

LVM快照空间回收

定位快照中占用最大的COW块

lvs -o +devices,metadata_percent 

Docker容器空间清理

查找体积最大的容器层

docker system df -v | grep GB | sort -k5 -h 

自动化运维:定时扫描与预警

Shell脚本示例

#!/bin/bash ALERT_THRESHOLD=1073741824  # 1GB LOG_FILE="/var/log/big_files_$(date +%Y%m%d).log"  find / -type f -size +${ALERT_THRESHOLD}c -exec ls -lh {} \; 2>/dev/null > ${LOG_FILE}  if [ -s ${LOG_FILE} ]; then     echo "发现超大文件!" | mail -a ${LOG_FILE} -s "磁盘空间警报" admin@example.com fi 

Systemd定时器配置

# /etc/systemd/system/disk-check.timer [Unit] Description=Daily disk space check  [Timer] OnCalendar=daily Persistent=true  [Install] WantedBy=timers.target 

禁忌与陷阱

  1. /proc/sys目录的误判风险

虚拟文件系统的特殊处理:

find /proc -size +100M  # 永远返回空结果 
  1. NFS挂载点的性能雪崩

使用-xdev避免网络遍历:

find /mnt/nfs -xdev -size +1G 
  1. ext4目录索引的优化策略

当单个目录文件过多时:

tune2fs -O dir_index /dev/sda1 

相关推荐

F5负载均衡器如何通过irules实现应用的灵活转发?

F5是非常强大的商业负载均衡器。除了处理性能强劲,以及高稳定性之外,F5还可以通过irules编写强大灵活的转发规则,实现web业务的灵活应用。irules是基于TCL语法的,每个iRules必须包含...

映射域名到NAS

前面介绍已经将域名映射到家庭路由器上,现在只需要在路由器上设置一下端口转发即可。假设NAS在内网的IP是192.168.1.100,NAS管理端口2000.你的域名是www.xxx.com,配置外部端...

转发(Forward)和重定向(Redirect)的区别

转发是服务器行为,重定向是客户端行为。转发(Forward)通过RequestDispatcher对象的forward(HttpServletRequestrequest,HttpServletRe...

SpringBoot应用中使用拦截器实现路由转发

1、背景项目中有一个SpringBoot开发的微服务,经过业务多年的演进,代码已经累积到令人恐怖的规模,亟需重构,将之拆解成多个微服务。该微服务的接口庞大,调用关系非常复杂,且实施重构的人员大部分不是...

公司想搭建个网站,网站如何进行域名解析?

域名解析是将域名指向网站空间IP,让人们通过注册的域名可以方便地访问到网站的一种服务。IP地址是网络上标识站点的数字地址,为方便记忆,采用域名来代替IP地址标识站点地址。域名解析就是域名到IP地址的转...

域名和IP地址什么关系?如何通过域名解析IP?

一般情况下,访客通过域名和IP地址都能访问到网站,那么两者之间有什么关系吗?本文中科三方针对域名和IP地址的关系和区别,以及如何实现域名与IP的绑定做下介绍。域名与IP地址之间的关系IP地址是计算机的...

分享网站域名301重定向的知识

网站域名做301重定向操作时,一般需要由专业的技术来协助完成,如果用户自己在维护,可以按照相应的说明进行操作。好了,下面说说重点,域名301重定向的操作步骤。首先,根据HTTP协议,在客户端向服务器发...

NAS外网到底安全吗?一文看懂HTTP/HTTPS和SSL证书

本内容来源于@什么值得买APP,观点仅代表作者本人|作者:可爱的小cherry搭好了NAS,但是不懂做好网络加密,那么隐私泄露也会随时发生!大家好,这里是Cherry,喜爱折腾、玩数码,热衷于分享数...

ForwardEmail免费、开源、加密的邮件转发服务

ForwardEmail是一款免费、加密和开源的邮件转发服务,设置简单只需4步即可正常使用,通过测试来看也要比ImprovMX好得多,转发近乎秒到且未进入垃圾箱(仅以Mailbox.org发送、Out...

使用CloudFlare进行域名重定向

当网站变更域名的时候,经常会使用域名重定向的方式,将老域名指向到新域名,这通常叫做:URL转发(URLFORWARDING),善于使用URL转发,对SEO来说非常有用,因为用这种方式能明确告知搜索引...

要将端口5002和5003通过Nginx代理到一个域名上的操作笔记

要将端口5002和5003通过Nginx代理到域名www.4rvi.cn的不同路径下,请按照以下步骤配置Nginx:步骤说明创建或编辑Nginx配置文件通常配置文件位于/etc/nginx/sites...

SEO浅谈:网站域名重定向的三种方式

在大多数情况下,我们输入网站访问网站的时候,很难发现www.***.com和***.com的区别,因为一般的网站主,都会把这两个域名指向到同一网站。但是对于网站运营和优化来说,www.***.com和...

花生壳出现诊断域名与转发服务器ip不一致的解决办法

出现诊断域名与转发服务器ip不一致您可以:1、更改客户端所处主机的drs为223.5.5.5备用dns为119.29.29.29;2、在windows上进入命令提示符输入ipconfig/flush...

涨知识了!带你认识什么是域名

1、什么是域名从技术角度来看,域名是在Internet上解决IP地址对应的一种方法。一个完整的域名由两个或两个以上部分组成,各部分之间用英文的句号“.”来分隔。如“abc.com”。其中“com”称...

域名被跳转到其他网站是怎么回事

当你输入域名时被跳转到另一个网站,这可能是由几种原因造成的:一、域名可能配置了域名转发服务。无论何时有人访问域名,比如.com、.top等,都会自动重定向到另一个指定的URL,这通常是在域名注册商设...

取消回复欢迎 发表评论: