百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

linux下定位文件的常用命令(linux定位进程文件路径)

nanshan 2025-05-05 17:46 13 浏览 0 评论

"find(1)是一种非常有用的shell脚本命令,但它往往被人们理解得不够透彻。这部分原因在于其复杂的语法(可以说是所有标准Unix命令中最复杂的,除了像awk这样的编程语言);另一部分原因在于手册页写得不好。在继续之前,你应该首先阅读一下系统中关于find命令的手册页。你不需要记住它,也不需要理解每个部分,但至少要浏览一遍,对整体有个大致的了解。然后,你可能会想查看OpenBSD的手册页进行对比。有时候,你会对某个手册页的理解更胜一筹。只要认识到不同实现并不相同;OpenBSD版可能具有你所缺乏的功能,反之亦然。但许多人发现BSD的手册页易于阅读,所以它可能对你理解概念有所帮助。

接下来,我们来谈谈find的作用,以及何时、如何使用它。

概述

这是基本思想:find向下遍历文件层级结构,匹配满足指定条件的文件,然后对它们执行操作。这非常重要,所以我再写一遍:

find向下遍历文件层级结构,
匹配满足指定条件的文件,然后
对它们执行操作。
让我们举几个快速示例,来说明它的基本操作。首先:

find .
.
./bar
./bar/foo.jpg
./foo.mp3
./apple.txt

如果你没有为当前目录指定".",一些版本的find会默认使用当前目录;其他版本可能会生成错误。你应该始终指定要遍历的目录。

如果你没有指定任何文件匹配的条件,find将匹配每个文件(包括目录、符号链接、块设备、字符设备、FIFO、套接字等等)。在我们的第一个示例中,我们没有添加任何标志,因此匹配了所有文件和目录。

最后,如果你没有指定要在每个匹配的文件上执行的操作,大多数现代版本的find会默认打印它们的名称到标准输出,并在每个文件名后加上换行符。(某些极旧的find版本可能什么也不做——最好明确指定操作。)如果我们想明确指定,可以这样写:

find . -print

这将产生与之前看到的相同的输出;我就不重复了。

你可能还观察到,find的输出不像ls(1)那样按字母顺序排序。它只是按照文件在目录中的出现顺序给出文件列表。"

基于名称搜索
现在,让我们应用一个过滤选项。假设我们只想找到以.jpg结尾的文件:

find . -name '*.jpg' -print
./bar/foo.jpg

在这种情况下,只有一个文件符合我们的条件,所以我们只得到一行输出。注意,find使用通配符来表示文件名匹配模式。还要注意,我们必须引用通配符,以防止shell对其进行扩展。我们希望find不要进行扩展,以便find可以将其应用于发现的每个文件名。

如果我们还想找到所有以.mp3结尾的文件:

find . \( -name '*.mp3' -o -name '*.jpg' \) -print
./bar/foo.jpg
./foo.mp3

这比我们之前展示的稍微复杂一些,所以让我们详细解释一下。核心部分是这样的:

-name '*.mp3' -o -name '*.jpg'

这简单地表示"我们要符合这个或者那个条件的文件"。-o是逻辑上的"或"运算符,并且是最常用的写法(某些其他版本的find也支持-or,但为什么要使用非便携标志,而且还要多敲击键呢?)。

我们用括号括起整个"或"表达式,因为我们希望它被视为一个单个单元,特别是当我们开始将其与其他表达式链接在一起时(正如我们将要做的那样)。括号本身必须完整传递给find,所以我们必须用反斜杠保护它们,因为括号对于shell也有特殊含义。我们还可以使用引号将括号括起来,而不是使用反斜杠。

最后,我们应用了显式的-print操作。满足我们条件的任何文件都会打印出它们的名称。

如果您想让文件满足多个条件,可以指定多个标志。只要将两个过滤器放在一起而没有-o在它们之间,就会隐含一个逻辑上的"与":

find . -name '*.mp3' -name '*.jpg' -print

这个命令不产生输出,因为我们要求所有以.mp3结尾并且以.jpg结尾的文件。显然,没有文件能同时满足这两个条件,所以我们什么也没得到。

现在,让我们像之前承诺的那样链接一个"或"和一个隐含的"与":

find . \( -name '*.mp3' -o -name '*.jpg' \) -name 'foo*' -print
./bar/foo.jpg
./foo.mp3

这里,我们与之前相同的"或"表达式:文件的名称必须以.mp3或.jpg结尾。此外,它的名称必须以foo开头。结果被显示出来。

注意,-name只匹配最深层目录中的文件名——在我们的示例中,是foo.jpg而不是foo/bar.jpg或./foo/bar.jpg。这就是为什么-name 'foo*'筛选器能够匹配它的原因。如果我们想查看目录名,我们必须使用-path筛选器:

find . -path 'bar*' -print

这将不会产生任何输出。为什么?请看这里:

find . -path './bar*' -print
./bar
./bar/foo.jpg

-path检查整个路径名,其中包括文件名(也就是你在find的-print输出中看到的内容),以便进行匹配。这也包括我们示例中的前导./。

(此时,我必须指出-path在每个find版本上都不可用。特别是,Solaris没有它。但在其他大多数系统中很常见。)

我们还可以对表达式取反:

griffon:/tmp/greg$ find . ! -path '*bar*' -print
.
./foo.mp3
./apple.txt

!取反后面的表达式,所以我们得到了每个不带bar的文件的完整路径名。

根据时间进行搜索

find最常见的用法之一是查找所有早于某个时间点的文件,例如相对于当前时间的"30天前"或其他文件。如果我们想要找到所有30天前修改过的文件(例如清理临时目录),我们可以使用:

find /tmp -mtime +30 -print

-mtime标志是用于检查文件时间戳的三个筛选器之一。Unix文件系统上的文件有三个时间戳:修改时间(mtime)、访问时间(atime)和更改时间(ctime)。没有地方存储文件的创建时间。

再次强调一下,对于那些不注意听的人:无法知道文件的创建时间。这个信息没有存储在任何地方。(除非在非标准文件系统上,只有在那些系统上才可能存储该信息。)

  • ext4和其他文件系统具有文件创建时间戳,但我不确定是否有任何find或stat支持它。(注:有。)
  • (注:随着时间的推移,任何通用的现代文件系统都会有创建时间 - ext4、xfs、zfs等等。只需注意,因为在某些文件系统上是ctime,而在其他文件系统上是crtime,在btrfs上是otime等等)
  • 并非所有当前使用的系统都是"现代化"的。许多应用程序运行在旧系统上。创建时间不是一个通用的特性。如果您的脚本只运行在具有该特性的系统上,那么可以放心使用它。但是如果将您的软件迁移到不同的平台上,请不要指望它存在。

在我们的示例中,我们使用了-mtime来查看文件的修改时间。这是我们运行ls -l时看到的时间戳,也是最常用的时间戳。每当通过写入更改文件内容时,它都会被更新。我们也可以使用-atime来查看文件的访问时间--这可以通过ls -lu看到,并且在文件被读取时更新(除非系统管理员在该文件系统上明确关闭了atime更新)。很少使用ctime(更改时间),它在文件元数据(权限、所有权等)发生更改时更新(例如,通过chmod命令)。

"+30"表示我们想要获取所有超过30天的文件。如果我们使用以下命令:

find . -mtime 30 -print

我们将得到所有恰好30天前(向最近一天四舍五入)的文件(具体定义请参阅手册)。这通常不太有用。然而,如果我们想要获取在过去30天内修改过的所有文件,我们可以使用以下命令:

find . -mtime -30 -print

这将给出所有修改时间在30天之内的文件。

一些find命令版本还具有-mmin、-amin和-cmin参数,允许以分钟为单位进行时间测量。这样可以查找例如在最近30分钟内修改过的所有文件。这些标志不属于POSIX标准,但它们存在于许多GNU和BSD系统中。

另一个根据时间匹配文件的常见用途是当我们想要查找自上次检查以来已修改过的所有文件时。该逻辑如下所示:

find /etc -newer /var/log/backup.timestamp -print
touch /var/log/backup.timestamp

这是进行增量系统备份的基本结构:查找自上次备份以来发生更改的所有文件,然后更新我们的时间戳文件以供下一次运行使用。(显然,为了进行有意义的备份,我们需要执行更多操作而不仅仅是-print显示文件,但我们将在接下来的部分中深入研究操作。)

学习更多shell有用知识


如果您觉得文章内容对你有一点帮助可以关注我,我在头条平台会持续分享更多实用的shell技巧和最佳实践,如果想系统的快速学习shell的各种高阶用法和生产环境避坑指南可以看看《shell脚本编程最佳实践》专栏,专栏里有更多的实用小技巧和脚本代码分享。

相关推荐

Linux 的磁盘系统,和你了解的Windows差别很大

我的C盘去哪了?一个系统,如果没有存储,那么也就不能称之为系统。存储性是一个完整系统的重要组成部分。例如AWS最开始的服务就是S3(用来存储数据的云服务),足以见得存储对于一个应用平台是多么的重要。...

一文读懂 Linux 硬盘挂载:从问题到解决方案

各位互联网大厂的后端开发伙伴们!在咱们日常工作中,操作Linux系统是常有的事儿吧。你们有没有遇到过这样的场景:新添加了一块硬盘,满心欢喜准备用来存储重要数据或者部署新的应用服务,却突然发现不知道...

硬盘分区(硬盘分区格式)

 磁盘(硬盘)分区,可以分C、D、E等分区,大家可能都会用,会根据自已的需要确定所需的空间,但分区是如何工作的呢,内容如下。Windows中有3类:MBR分区:MasterBootRecord,也...

parted命令工具分区介绍(particle命令)

linux系统磁盘分区通常可以使用fdisk和parted命令,当分区大小小于2TB的时候,两种皆可以使用,当分区大于2TB的话,就需要用parted分区。以下介绍parted命令相关使用,以sdb为...

Linux 服务器上查看磁盘类型的方法

方法1:使用lsblk命令lsblk输出说明:TYPE列显示设备类型,如disk(物理磁盘)、part(分区)、rom(只读存储)等。NAME列显示设备名称(如sda、nvme0n1)。TR...

Linux分区命令fdisk和parted使用介绍

摘要:一般情况下,Linux分区都是选择fdisk工具,要求硬盘格式为MBR格式,能支持的最大分区空间为2T。但是目前在实际生产环境中使用的磁盘空间越来越大,呈TB级别增长;而常用的fdisk这个工具...

linux 分区原理与名词解释(linux操作系统中的分区类型)

分区的意义将磁盘分成几份,每份挂在到文件系统的那个目录在linux里的文件系统Ext2:早期的格式,不支持日志功能Ext3:ext2改良版,增加了日志功能,是最基本且最常用的使用格式了Ext4:针对e...

linux 分区合并(linux合理分区)

查看虚拟机当前磁盘挂载情况fdisk-l选择磁盘fdisk/dev/sda查看磁盘分区情况p重新选择分区n选择主分区p保存w创建物理卷pvcreate/dev/sda3查看物理卷信息pvdi...

如何在 Linux 系统中永久禁用交换分区 ?

Linux操作系统中的交换分区或交换文件充当硬盘上的临时存储区域,当物理内存(RAM)满时,系统使用该存储区域。它用于交换较少使用的内存页,这样系统就不会因为运行应用程序而耗尽物理内存。随着技术的发...

Linux 如何知道硬盘已用多少空间、未用多少空间

刚出社会时,去了一家公司上班,老板为了省钱,买的服务器是低配的,硬盘大小只有40G,有一次网站突然不能访问了,排查半天才知道原来服务器的硬盘空间已用完,已无可用空间。第一步是查看硬盘的使用情况,第二步...

用Linux系统管理磁盘空间 就该这么来

要想充分有效的管理使用Linux系统中的存储空间,用户必须要做的就是双管齐下,一边扩充空间一边限制空间。不得不说的就是很多时候磁盘空间就像水资源,需节制水流。说到要如何实现限制空间就离不开使用LVM技...

Windows 11 磁盘怎么分区?(windows11磁盘怎么分区)

Windows11磁盘分区技术解析与操作指南:构建高效存储体系一、磁盘分区的技术本质与系统价值磁盘分区作为存储系统的基础架构,通过逻辑划分实现数据隔离与管理优化。Windows11采用NTF...

linux上创建多个文件分区,格式化为 ext2、ext3、ext4、XFS 文件

以下是在Linux系统上创建多个20GB文件分区并格式化为不同文件系统的分步指南:步骤1:创建基础文件(4个20GB文件)bash#创建4个20GB稀疏文件(实际占用空间随写入量增长)ddif=/...

救命的U盘低格哪家最强?(低格优盘)

周二时有位童鞋留言说U盘之前做过引导盘,现在格式化不了,用各种工具都不行,而且因为U盘厂商的关系,查不到U盘主控,无法量产恢复,特来求助。小编花了点时间特意弄坏一个U盘分区,终于试出方法了,特来分享一...

Linux 查看硬件磁盘存储大小和磁盘阵列(RAID)的组合方式

一、查看硬件磁盘存储大小查看所有磁盘信息:#lsblk该命令会列出所有磁盘(如/dev/sda、/dev/nvme0n1)及其分区和挂载点。查看磁盘总容量:fdisk-l#或parted-...

取消回复欢迎 发表评论: