find
命令是 Linux 系统中强大的文件搜索工具,使用它可以方便的按文件名,文件类型,编辑时间,所属用户,权限等各种条件搜索自己所需要的文件。除了搜索功能,find
命令还支持对搜索出来的文件进行后续处理。
友情提示,本文所介绍的为 GUN 版本的 find
命令。为确保你能顺利通过本文所介绍的内容尝试 find
命令,请先通过以下命令确认自己当前 Linux 系统所搭配的 find
命令为 GUN 版本:
find --version
如果输出如下类似的信息,那就没问题了。
find (GNU findutils) 4.8.0
Copyright (C) 2021 Free Software Foundation, Inc.
find 命令格式
find [搜索路径...] [表达式]
find
命令由两部分组成:
- 搜索路径:指定要搜索的目录地址,可以通过空格的方式来提供多个搜索地址。
- 表达式:也就是命令的搜索语法,由各种预定义的选项和传参组成。可以通过多个表达式组合过滤文件。
命令在执行时会搜索指定目录下所有文件和文件夹,然后根据表达式中给定的条件从左至右,按照运算符的优先规则依次运行。关于 find
命令的运算符和优先规则,可以参考后面的「表达式运算符」参考列表。
在命令中,以 -
,(
,)
,,
或是 !
这些字符开头的参数都代表着表达式的开始。在此之前的任何内容都会被认为是命令的搜索路径。命令默认的路径是当前目录,默认的表达式是 -print
。执行一个不带任何参数的 find
命令意思是打印出当前目录下所有的文件和目录。
find 命令示例
通过示例是快速了解 find
命令用法的最佳途径。在自己的 Linux 系统上亲手敲入这些例子中的命令,掌握格式后举一反三,也能更牢固的掌握此命令的用法。另外此处的示例只是列举了该命令几个比较典型的用法,并没有囊括命令所适用的所有场景。参考后面的命令参考部分可以查阅更加丰富的选项参数,并根据自己的需要来选择并加以使用。
在当前目录下查找所有 .txt 后缀的文件:
find . -name '*.txt'
在当前目录下查找以大写开头的文件,包括文件夹:
find . -name '[A-Z]*'
在 /etc 和当前用户主目录下查找以 t
开头的文件或文件夹:
find /etc ~ -name 't*'
跟上面类似,不过限定为只查找文件:
find /etc ~ -name 't*' -type f
在 /etc 目录下查找所有的符号链接文件:
find /etc -type l
在 /etc 目录查找权限为 755 的文件或文件夹:
find /etc -perm 755
在 /etc 目录查找大小超过 1K 的文件:
find /etc -size +1000c
在当前目录查找 3 天内编辑过的文件:
find . -mtime -3
在当前目录查找属于 zzxworld 用户的文件:
find . -user zzxworld
在当前目录查找属于 zzxworld 用户组的文件:
find . -group zzxworld
在当前目录查找内容为空的文件:
find . -empty
在当前目录查找当天修改过的文件,并用 ls
命令显示它们的信息:
find . -mtime -1 -type f -exec ls -l {} \;
找出当前目录下以 .log 结尾的文件,并复制到 /backup/logs 目录:
find . -name '*.log' -exec cp {} /backup/log \;
find 命令表达式参考
表达式是 find
命令中最重要的部分。根据用途,分为「选项」,「测试」,「动作」和「运算符」。关于这三类的参数定义整理如下。
选项参考
参数名称 | 说明 |
---|---|
-daystart |
从当日起始时开始而不是从 24 小时之前,计算时间(for -amin , -atime , -cmin , -ctime , -mmin , and -mtime )。 |
-depth |
先处理目录的内容再处理目录本身。 |
-follow |
不检索符号链接。隐含了 -noleaf 。 |
-help , --help |
列出 find 的命令行用法的概要,然后退出。 |
-maxdepth levels |
进入命令行参数指定的目录下层目录时,最深不超过 levels (一个非负整数) 层。-maxdepth 0 意味着只在命令行参数指定的目录中执行测试和动作。 |
-mindepth levels |
不在 levels (一个非负整数)层之内执行任何测试和动作。-mindepth 1 意 味着处理所有的文件,除了命令行参数指定的目录中的文件。 |
-mount |
不进入处于其它文件系统之上的目录。可以用 -xdev 代替,从而和一些其他版本的 find 兼容。 |
-noleaf |
不为「目录中子目录数量比硬连接数少 2」 这种假设做优化。这个选项在搜索那些不遵循 UNIX 文件系统链接约定的文件系统时用,比如 CD-ROM, MS-DOS 文件系统或 AFS 卷的加载点。在普通的 UNIX 文件系统中,每个目录至少有两个硬连接,它的名字和它的 '.' 条目。另外它的子目录(假如有)还会各有一个 '..' 链接到它。在 find 检索一个目录时,发现子目录数比它的连接数少二时,它就知道目录中的其他条目并非目录(而是目录树中的叶(leaf )节点)。除非需要检索的是这个叶节点,否则没必要去处理它。这样可以带来很大的搜索速度提升。 |
-version , --version |
打印 find 的版本号然后退出。 |
-xdev |
不进入处于其他文件系统之上的目录。 |
测试参考
参数名称 | 说明 |
---|---|
-amin n |
对文件的最近一次访问是在 n 分钟之前。 |
-anewer file |
对文件的最近一次访问比 file 修改时间要晚。如果命令行中 -follow 在 -anewer 之前,(也只有在这种情况下) -anewer 会受 -follow 的影响。 |
-atime n |
对文件的最近一次访问是在 n*24 小时之前。 |
-cmin n |
对文件状态的最近一次修改是在 n 分钟之前。 |
-cnewer file |
对文件状态的最近一次修改比 file 修改时间要晚。如果命令行中 -follow 在 -cnewer 之前,(也只有在这种情况下) -cnewer 会受 -follow 的影响。 |
-ctime n |
对文件状态的最近一次修改是在 n*24 小时之前。 |
-empty |
文件是空的普通文件或者空目录。 |
-false |
总是 false。 |
-fstype type |
文件处于 type 类型的文件系统之上。有效的文件系统类型在不同版本的 Unix 中是不同的;一些 Unix 中的不完全的文件系统类型列表是这样:ufs, 4.2, 4.3, nfs, tmp, mfs, S51K, S52K. 你可以用 -printf 加上 %F 指令来查看你的文件系统的类型。 |
-gid n |
文件的数字形式的组 ID 是 n。 |
-group gname |
文件属于 gname (也允许使用数字形式的组ID)。 |
-ilname pattern |
和 -lname 类似,但是匹配时是不区分大小写的。 |
-iname pattern |
和 -name 类似,但是匹配时是不区分大小写的。例如,fo* and F?? 模式与文件名 Foo , FOO , foo , fOo 等等相匹配。 |
-inum n |
文件的 i 结点数是 n。 |
-ipath pattern |
和 -path 类似,但是匹配时是不区分大小写的。 |
-iregex pattern |
和 -regex 类似, 但是匹配时是不区分大小写的。 |
-links n |
文件有 n 个链接。 |
-lname pattern |
文件是一个与 pattern 匹配的符号链接。元字符不会对 / 或 . 做特殊处理。 |
-mmin n |
对文件数据的最近一次修改是在 n 分钟之前。 |
-mtime n |
对文件数据的最近一次修改是在 n*24 小时之前。 |
-name pattern |
基本的文件名(将路径去掉了前面的目录)与 shell 模式 pattern 相匹配。元字符(* , ? , 还有[] ) 不会匹配文件名开头的 . 。使用 -prune 来略过一个目录及其中的文件。查看 -path 的描述中的范例。 |
-newer file |
对文件的最近一次修改比 file 修改时间要晚。如果命令行中 -follow 在 -newer 之前,(也只有在这种情况下) -newer 会受 -follow 的影响。 |
-nouser |
没有符合文件的数字形式的用户 ID 的用户。 |
-nogroup |
没有符合文件的数字形式的组 ID 的组。 |
-path pattern |
文件名与shell模式 pattern 相匹配。元字符不会对 / 或 . 做特殊处理。因此,例如:find . -path './sr*sc' 如果存在 ./src/misc 的话,会将它打印出来。想要忽略一个完整的目录树,应当使用 -prune 而不是检查目录树中所有的文件。例如:要跳过 src/emacs 目录和其中所有的文件和子目录,把其他找到的文件打印出来,应当这样:find . -path './src/emacs' -prune -o -print 。 |
-perm mode |
文件的权限位恰好是 mode (八进制或符号)。 |
-perm -mode |
所有的权限位 mode 都被设置了的文件。 |
-perm +mode |
任何权限位 mode 被设置了的文件。 |
-regex pattern |
文件名与正则表达式 pattern 匹配。这是对整个路径的匹配,不是搜索文件。例如,要匹配名为./fubar3 的文件,可以使用正则表达式 .*bar. 或者 .*b.*3 ,但是不能用b.*r3 。 |
-size n[bckw] |
文件使用了 n 单位个存储单元。默认的单位是 512 字节的块,也可以用 n 后面加上 b 来指定这个值。其他的单位是字节,如果在 n 后面加上 c ;千字节(kB),如果在 n 后面加上 k ;两字节的字,如果在 n 后面加上 w 。大小不会计入 indirect blocks,但是会计入没有真正分配空间的疏松文件中的块。 |
-true |
总是 true。 |
-type c |
文件是 c 类型的,关于这个 c 的取值,可以参考表格后的列表。 |
-uid n |
文件的数字形式的用户 ID 是 n 。 |
-used n |
文件最后一次存取是在最后一次修改它的状态的 n 天之后。 |
-user uname |
文件的所有者是 uname (也可以使用数字形式的用户 ID)。 |
-xtype c |
和 -type 相同,除非文件是一个符号链接。对于符号链接:如果没有给出 -follow ,如果文件是一个指向 c 类型文件的链接,那么返回 true ;如果给出了 -follow ,如果 c 是 l 那么返回 true。换句话说,对于符号链接,-xtype 检查那些 -type 不检查的文件。 |
💡 上面表格中的一些数字参数支持以下三种格式:
+n
表示比 n 要大-n
表示比 n 要小n
等于 n
💡 上面表格中的 -type
参数可以使用以下值:
b
: 特殊块文件(缓冲的)c
: 特殊字符文件(不缓冲)d
: 目录p
: 命名管道 (FIFO)f
: 普通文件l
: 符号链接s
: 套接字D
: 门 (Solaris 特有)
动作参考
参数名称 | 说明 |
---|---|
-exec command ; |
执行 command;如果命令返回状态值 0,那么 exec 返回 true。所有 find 其余的命令行参数将作为提供给命令的参数,直到遇到一个由 ; 组成的参数为止。命令的参数中,字符串 {} 将以正在处理的文件名替换。所有的 {} 都会被替换,不仅是在单独的一个参数中。有些版本的 find 不是这样做的。这些参数可能需要用 \ 来 escape 或者用括号括住,防止它们被 shell 展开。命令是从起始目录执行的。 |
-fls file |
返回 true;类似 -ls 但是像 -fprint 那样写入 file。 |
-fprint file |
返回 true;将文件全名打印到文件 file 中。如果运行 find 时 file 不存在,那么它将被创建。如果它存在,它将被覆盖。文件名 /dev/stdout 和 /dev/stderr 会作特殊处理;它们分别指的是标准输出和标准错误输出。 |
-fprint0 file |
返回 true;类似 -print0 但是像 -fprint 那样写入 file。 |
-fprintf file format |
返回 true;类似 -printf 但是像 -fprint 那样写入 file。 |
-ok command ; |
类似 -exec 但是会先向用户询问 (在标准输入); 如果回应不是以 y 或 Y 起始则不会运行 command 而是返回false。 |
-print |
返回 true;在标准输出打印文件全名,然后是一个换行符。 |
-print0 |
返回 true;在标准输出打印文件全名,然后是一个 null 字符。这样可以使得处理 find 的输出的程序可以正确地理解带有换行符的文件名。 |
-printf format |
返回 true;在标准输出打印 format , 解释 \ escape 还有 % 指令。字段宽度和精度可以像 C 函数 printf 那样来指定。与 -print 不同的是, -printf 在字符串末端不会添加一个新行。可用的 escape 和指令参考本表格后的列表。 |
-prune |
如果没有给出 -depth 则返回 true; 不进入当前目录。如果给出了 -depth 则返回 false; 没有效果。 |
-ls |
返回 true;以 ls -dils 格式在标准输出列出文件。块以 1kB 字节为单位计数,除非设置了环境变量 POSIXLY_CORRECT ,那样的话会使用 512 字节的块。 |
💡 上表中的 -printf
参数可以使用的 format escape 指令如下:
\a
: 警告铃声\b
: 回退\c
: 立即停止以当前格式输出,刷新输出设备。\f
: 表格结束\n
: 新行\r
: 回车\t
: 水平 tab\v
: 竖直 tab\\
: 输出\
符号\NNN
: ASCII 编码是 NNN(八进制) 的字符在一个\
字符后面使用任何其他字符会被作为普通的字符,因此它们都会被打印出来%%
: 输出自身%
%a
: 文件最后一次存取的时间。格式是C函数ctime
返回值的格式%Ak
: 文件最后一次存取的时间。格式以 k 指定,可以是@
或者是 C 函数strftime
的指令格式。下面列出了 k 可用的值;有一些并不是在所有系统上都可用,因为不同系统中strftime
也不同。@
: 从 Jan. 1, 1970, 00:00 GMT 起的秒数H
: 小时 (00..23)I
: 小时 (01..12)k
: 小时 ( 0..23)l
: 小时 ( 1..12)M
: 分钟 (00..59)p
: 本地的 AM 或者 PMr
: 12小时格式的时间 (hh:mm:ss [AP]M)S
: 秒 (00..61)T
: 24小时格式的时间 (hh:mm:ss)X
: 本地的时间表示方法 (H:M:S)Z
: 时区(例如,EDT),如果不能决定时区就是空a
: 本地一星期中每天的名称的缩写(Sun..Sat)A
: 本地一星期中每天的全名,可变长度 (Sunday..Saturday)b
: 本地每月的名称的缩写 (Jan..Dec)B
: 本地每月的全名,可变长度 (January..December)c
: 本地的日期和时间表示 (Sat Nov 04 12:02:33 EST 1989)d
: 一个月当中的日子 (01..31)D
: 日期 (mm/dd/yy)h
: 与 b 相同j
: 一年当中的日子 (001..366)m
: 月份 (01..12)U
: 以星期日作为每周起始,一年当中的星期 (00..53)w
: 一星期当中的日子 (0..6)W
: 以星期一当作每周起始,一年当中的星期 (00..53)x
: 本地的日期表示 (mm/dd/yy)y
: 年份的最后两位 (00..99)Y
: 年份 (1970...)
%b
: 文件大小,以 512 字节的块为单位 (四舍五入)%c
: 文件状态最后一次修改的时间。格式是C函数ctime
返回值的格式%Ck
: 文件状态最后一次修改的时间。格式以 k 指定,类似于%A
%d
: 文件在目录树中的深度;0 意味着文件是一个命令行参数%f
: 去掉了前面的目录的文件名 (只剩下最后的成分)%F
: 文件所在文件系统的类型;这个值可以为-fstype
所用%g
: 文件的组名,如果组没有名称就是数字形式的组 ID%G
: 文件的数字形式的组 ID%h
: 文件名的前面的目录部分 (仅除去最后的成分)%H
: 据以找到了文件的命令行参数%i
: 文件的 i 结点号(16 进制)%k
: 文件大小,以 1kB 的块为单位 (四舍五入)%l
: 符号链接的目标 (如果文件不是一个符号链接,那么结果是空字符串)%m
: 文件的权限位 (8 进制)%n
: 文件的硬连接数%p
: 文件名%P
: 文件名,去掉了据以找到了文件的命令行参数的名称部分%s
: 文件大小,以字节为单位%t
: 文件最后一次修改的时间。格式是 C 函数ctime
返回值的格式%Tk
: 文件最后一次修改的时间。格式以 k 指定,类似于%A
%u
: 文件的用户名,如果用户没有名称就是数字形式的用户 ID%U
: 文件的数字形式的用户 ID
⚠️ 在一个 %
字符后面使用任何其他字符,`%' 将被忽略 (但是其他字符会被打印出来)。
运算符参考
以下运算符按优先级从高到低的顺序排列。
运算符格式 | 说明 |
---|---|
( expr ) |
强制为优先 |
! expr |
如果 expr 是 false 则返回 true |
-not expr |
与 ! expr 相同 |
expr1 expr2 |
与 (隐含的默认运算符);如果 expr1 为 false 则不会执行 expr2 |
expr1 -a expr2 |
与 expr1 expr2 相同 |
expr1 -and expr2 |
与 expr1 expr2 相同 |
expr1 -o expr2 |
或;如果 expr1 为 true 则不会执行 expr2 |
expr1 -or expr2 |
与 expr1 -o expr2 相同 |
expr1 , expr2 |
列表;expr1 和 expr2 都会被执行。expr1 的值被忽略,列表的值是 expr2 的值 |