百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 编程字典 > 正文

linux下定位文件的常用命令

toyiye 2024-06-21 12:21 11 浏览 0 评论

定位文件的用法

"find(1)是一种非常有用的shell脚本命令,但它往往被人们理解得不够透彻。这部分原因在于其复杂的语法(可以说是所有标准Unix命令中最复杂的,除了像awk这样的编程语言);另一部分原因在于手册页写得不好。在继续之前,你应该首先阅读一下系统中关于find命令的手册页。你不需要记住它,也不需要理解每个部分,但至少要浏览一遍,对整体有个大致的了解。然后,你可能会想查看OpenBSD的手册页进行对比。有时候,你会对某个手册页的理解更胜一筹。只要认识到不同实现并不相同;OpenBSD版可能具有你所缺乏的功能,反之亦然。但许多人发现BSD的手册页易于阅读,所以它可能对你理解概念有所帮助。

接下来,我们来谈谈find的作用,以及何时、如何使用它。

概述

这是基本思想:find向下遍历文件层级结构,匹配满足指定条件的文件,然后对它们执行操作。这非常重要,所以我再写一遍:

find向下遍历文件层级结构,
匹配满足指定条件的文件,然后
对它们执行操作。
让我们举几个快速示例,来说明它的基本操作。首先:

find .
.
./bar
./bar/foo.jpg
./foo.mp3
./apple.txt

如果你没有为当前目录指定".",一些版本的find会默认使用当前目录;其他版本可能会生成错误。你应该始终指定要遍历的目录。

如果你没有指定任何文件匹配的条件,find将匹配每个文件(包括目录、符号链接、块设备、字符设备、FIFO、套接字等等)。在我们的第一个示例中,我们没有添加任何标志,因此匹配了所有文件和目录。

最后,如果你没有指定要在每个匹配的文件上执行的操作,大多数现代版本的find会默认打印它们的名称到标准输出,并在每个文件名后加上换行符。(某些极旧的find版本可能什么也不做——最好明确指定操作。)如果我们想明确指定,可以这样写:

find . -print

这将产生与之前看到的相同的输出;我就不重复了。

你可能还观察到,find的输出不像ls(1)那样按字母顺序排序。它只是按照文件在目录中的出现顺序给出文件列表。"

基于名称搜索
现在,让我们应用一个过滤选项。假设我们只想找到以.jpg结尾的文件:

find . -name '*.jpg' -print
./bar/foo.jpg

在这种情况下,只有一个文件符合我们的条件,所以我们只得到一行输出。注意,find使用通配符来表示文件名匹配模式。还要注意,我们必须引用通配符,以防止shell对其进行扩展。我们希望find不要进行扩展,以便find可以将其应用于发现的每个文件名。

如果我们还想找到所有以.mp3结尾的文件:

find . \( -name '*.mp3' -o -name '*.jpg' \) -print
./bar/foo.jpg
./foo.mp3

这比我们之前展示的稍微复杂一些,所以让我们详细解释一下。核心部分是这样的:

-name '*.mp3' -o -name '*.jpg'

这简单地表示"我们要符合这个或者那个条件的文件"。-o是逻辑上的"或"运算符,并且是最常用的写法(某些其他版本的find也支持-or,但为什么要使用非便携标志,而且还要多敲击键呢?)。

我们用括号括起整个"或"表达式,因为我们希望它被视为一个单个单元,特别是当我们开始将其与其他表达式链接在一起时(正如我们将要做的那样)。括号本身必须完整传递给find,所以我们必须用反斜杠保护它们,因为括号对于shell也有特殊含义。我们还可以使用引号将括号括起来,而不是使用反斜杠。

最后,我们应用了显式的-print操作。满足我们条件的任何文件都会打印出它们的名称。

如果您想让文件满足多个条件,可以指定多个标志。只要将两个过滤器放在一起而没有-o在它们之间,就会隐含一个逻辑上的"与":

find . -name '*.mp3' -name '*.jpg' -print

这个命令不产生输出,因为我们要求所有以.mp3结尾并且以.jpg结尾的文件。显然,没有文件能同时满足这两个条件,所以我们什么也没得到。

现在,让我们像之前承诺的那样链接一个"或"和一个隐含的"与":

find . \( -name '*.mp3' -o -name '*.jpg' \) -name 'foo*' -print
./bar/foo.jpg
./foo.mp3

这里,我们与之前相同的"或"表达式:文件的名称必须以.mp3或.jpg结尾。此外,它的名称必须以foo开头。结果被显示出来。

注意,-name只匹配最深层目录中的文件名——在我们的示例中,是foo.jpg而不是foo/bar.jpg或./foo/bar.jpg。这就是为什么-name 'foo*'筛选器能够匹配它的原因。如果我们想查看目录名,我们必须使用-path筛选器:

find . -path 'bar*' -print

这将不会产生任何输出。为什么?请看这里:

find . -path './bar*' -print
./bar
./bar/foo.jpg

-path检查整个路径名,其中包括文件名(也就是你在find的-print输出中看到的内容),以便进行匹配。这也包括我们示例中的前导./。

(此时,我必须指出-path在每个find版本上都不可用。特别是,Solaris没有它。但在其他大多数系统中很常见。)

我们还可以对表达式取反:

griffon:/tmp/greg$ find . ! -path '*bar*' -print
.
./foo.mp3
./apple.txt

!取反后面的表达式,所以我们得到了每个不带bar的文件的完整路径名。

根据时间进行搜索

find最常见的用法之一是查找所有早于某个时间点的文件,例如相对于当前时间的"30天前"或其他文件。如果我们想要找到所有30天前修改过的文件(例如清理临时目录),我们可以使用:

find /tmp -mtime +30 -print

-mtime标志是用于检查文件时间戳的三个筛选器之一。Unix文件系统上的文件有三个时间戳:修改时间(mtime)、访问时间(atime)和更改时间(ctime)。没有地方存储文件的创建时间。

再次强调一下,对于那些不注意听的人:无法知道文件的创建时间。这个信息没有存储在任何地方。(除非在非标准文件系统上,只有在那些系统上才可能存储该信息。)

  • ext4和其他文件系统具有文件创建时间戳,但我不确定是否有任何find或stat支持它。(注:有。)
  • (注:随着时间的推移,任何通用的现代文件系统都会有创建时间 - ext4、xfs、zfs等等。只需注意,因为在某些文件系统上是ctime,而在其他文件系统上是crtime,在btrfs上是otime等等)
  • 并非所有当前使用的系统都是"现代化"的。许多应用程序运行在旧系统上。创建时间不是一个通用的特性。如果您的脚本只运行在具有该特性的系统上,那么可以放心使用它。但是如果将您的软件迁移到不同的平台上,请不要指望它存在。

在我们的示例中,我们使用了-mtime来查看文件的修改时间。这是我们运行ls -l时看到的时间戳,也是最常用的时间戳。每当通过写入更改文件内容时,它都会被更新。我们也可以使用-atime来查看文件的访问时间--这可以通过ls -lu看到,并且在文件被读取时更新(除非系统管理员在该文件系统上明确关闭了atime更新)。很少使用ctime(更改时间),它在文件元数据(权限、所有权等)发生更改时更新(例如,通过chmod命令)。

"+30"表示我们想要获取所有超过30天的文件。如果我们使用以下命令:

find . -mtime 30 -print

我们将得到所有恰好30天前(向最近一天四舍五入)的文件(具体定义请参阅手册)。这通常不太有用。然而,如果我们想要获取在过去30天内修改过的所有文件,我们可以使用以下命令:

find . -mtime -30 -print

这将给出所有修改时间在30天之内的文件。

一些find命令版本还具有-mmin、-amin和-cmin参数,允许以分钟为单位进行时间测量。这样可以查找例如在最近30分钟内修改过的所有文件。这些标志不属于POSIX标准,但它们存在于许多GNU和BSD系统中。

另一个根据时间匹配文件的常见用途是当我们想要查找自上次检查以来已修改过的所有文件时。该逻辑如下所示:

find /etc -newer /var/log/backup.timestamp -print
touch /var/log/backup.timestamp

这是进行增量系统备份的基本结构:查找自上次备份以来发生更改的所有文件,然后更新我们的时间戳文件以供下一次运行使用。(显然,为了进行有意义的备份,我们需要执行更多操作而不仅仅是-print显示文件,但我们将在接下来的部分中深入研究操作。)

学习更多shell有用知识


如果您觉得文章内容对你有一点帮助可以关注我,我在头条平台会持续分享更多实用的shell技巧和最佳实践,如果想系统的快速学习shell的各种高阶用法和生产环境避坑指南可以看看《shell脚本编程最佳实践》专栏,专栏里有更多的实用小技巧和脚本代码分享。

相关推荐

为何越来越多的编程语言使用JSON(为什么编程)

JSON是JavascriptObjectNotation的缩写,意思是Javascript对象表示法,是一种易于人类阅读和对编程友好的文本数据传递方法,是JavaScript语言规范定义的一个子...

何时在数据库中使用 JSON(数据库用json格式存储)

在本文中,您将了解何时应考虑将JSON数据类型添加到表中以及何时应避免使用它们。每天?分享?最新?软件?开发?,Devops,敏捷?,测试?以及?项目?管理?最新?,最热门?的?文章?,每天?花?...

MySQL 从零开始:05 数据类型(mysql数据类型有哪些,并举例)

前面的讲解中已经接触到了表的创建,表的创建是对字段的声明,比如:上述语句声明了字段的名称、类型、所占空间、默认值和是否可以为空等信息。其中的int、varchar、char和decimal都...

JSON对象花样进阶(json格式对象)

一、引言在现代Web开发中,JSON(JavaScriptObjectNotation)已经成为数据交换的标准格式。无论是从前端向后端发送数据,还是从后端接收数据,JSON都是不可或缺的一部分。...

深入理解 JSON 和 Form-data(json和formdata提交区别)

在讨论现代网络开发与API设计的语境下,理解客户端和服务器间如何有效且可靠地交换数据变得尤为关键。这里,特别值得关注的是两种主流数据格式:...

JSON 语法(json 语法 priority)

JSON语法是JavaScript语法的子集。JSON语法规则JSON语法是JavaScript对象表示法语法的子集。数据在名称/值对中数据由逗号分隔花括号保存对象方括号保存数组JS...

JSON语法详解(json的语法规则)

JSON语法规则JSON语法是JavaScript对象表示法语法的子集。数据在名称/值对中数据由逗号分隔大括号保存对象中括号保存数组注意:json的key是字符串,且必须是双引号,不能是单引号...

MySQL JSON数据类型操作(mysql的json)

概述mysql自5.7.8版本开始,就支持了json结构的数据存储和查询,这表明了mysql也在不断的学习和增加nosql数据库的有点。但mysql毕竟是关系型数据库,在处理json这种非结构化的数据...

JSON的数据模式(json数据格式示例)

像XML模式一样,JSON数据格式也有Schema,这是一个基于JSON格式的规范。JSON模式也以JSON格式编写。它用于验证JSON数据。JSON模式示例以下代码显示了基本的JSON模式。{"...

前端学习——JSON格式详解(后端json格式)

JSON(JavaScriptObjectNotation)是一种轻量级的数据交换格式。易于人阅读和编写。同时也易于机器解析和生成。它基于JavaScriptProgrammingLa...

什么是 JSON:详解 JSON 及其优势(什么叫json)

现在程序员还有谁不知道JSON吗?无论对于前端还是后端,JSON都是一种常见的数据格式。那么JSON到底是什么呢?JSON的定义...

PostgreSQL JSON 类型:处理结构化数据

PostgreSQL提供JSON类型,以存储结构化数据。JSON是一种开放的数据格式,可用于存储各种类型的值。什么是JSON类型?JSON类型表示JSON(JavaScriptO...

JavaScript:JSON、三种包装类(javascript 包)

JOSN:我们希望可以将一个对象在不同的语言中进行传递,以达到通信的目的,最佳方式就是将一个对象转换为字符串的形式JSON(JavaScriptObjectNotation)-JS的对象表示法...

Python数据分析 只要1分钟 教你玩转JSON 全程干货

Json简介:Json,全名JavaScriptObjectNotation,JSON(JavaScriptObjectNotation(记号、标记))是一种轻量级的数据交换格式。它基于J...

比较一下JSON与XML两种数据格式?(json和xml哪个好)

JSON(JavaScriptObjectNotation)和XML(eXtensibleMarkupLanguage)是在日常开发中比较常用的两种数据格式,它们主要的作用就是用来进行数据的传...

取消回复欢迎 发表评论:

请填写验证码