Python的标准库包括大量工具,可以处理文件系统中的文件、构造和文件名,甚至解析和检查文件的内容。以下我们将一一介绍新手入门必知的几个Python标准库。
1. os.path(平台独立的文件名管理)
模块中的函数,很容易在多个平台上处理文件的代码。即使程序不打算在平台之间移植,也应该使用os.path来完成可靠的文件名解析。
os.path.abspath(path) #返回绝对路径
os.path.basename(path) #返回文件名
os.path.commonprefix(list) #返回list(多个路径)中,所有path共有的最长的路径。
os.path.dirname(path) #返回文件路径
os.path.exists(path) #路径存在则返回True,路径损坏返回False
os.path.lexists #路径存在则返回True,路径损坏也返回True
os.path.expanduser(path) #把path中包含的"~"和"~user"转换成用户目录
os.path.expandvars(path) #根据环境变量的值替换path中包含的”$name”和”${name}”
os.path.getatime(path) #返回最后一次进入此path的时间。
os.path.getmtime(path) #返回在此path下最后一次修改的时间。
os.path.getctime(path) #返回path的大小
os.path.getsize(path) #返回文件大小,如果文件不存在就返回错误
os.path.isabs(path) #判断是否为绝对路径
os.path.isfile(path) #判断路径是否为文件
os.path.isdir(path) #判断路径是否为目录
os.path.islink(path) #判断路径是否为链接
os.path.ismount(path) #判断路径是否为挂载点()
os.path.join(path1[, path2[, ...]]) #把目录和文件名合成一个路径
os.path.normcase(path) #转换path的大小写和斜杠
os.path.normpath(path) #规范path字符串形式
os.path.realpath(path) #返回path的真实路径
os.path.relpath(path[, start]) #从start开始计算相对路径
os.path.samefile(path1, path2) #判断目录或文件是否相同
os.path.sameopenfile(fp1, fp2) #判断fp1和fp2是否指向同一文件
os.path.samestat(stat1, stat2) #判断stat tuple stat1和stat2是否指向同一个文件
os.path.split(path) #把路径分割成dirname和basename,返回一个元组
os.path.splitdrive(path) #一般用在windows下,返回驱动器名和路径组成的元组
os.path.splitext(path) #分割路径,返回路径名和文件扩展名的元组
os.path.splitunc(path) #把路径分割为加载点与文件
os.path.walk(path, visit, arg) #遍历path,进入每个目录都调用visit函数,visit函数必须有
2. glob(文件名模式匹配)
尽管glob api很小,但这个模块很强大,只要程序需要查找文件系统中名字与某种模式匹配一组文件,就可以使用此模块,要创建一个文件名列表,要求其中各个文件名都某个特定的扩展名,前缀或者中间都有某个共同字符串。就可以使用glob而不是编写定制代码来扫描目录内容。glob模式与正则re模式使用正则表达式并不相同,实际上。glob模式遵循标准unix路径扩展规则,只使用几个特殊字符来实现2个不同的通配符和字符区间,模式规则要应用于文件名中段(在路径分隔符/处截止)。模式中路径可以是相对/绝对路径,shell变量名波浪线(~)都不会以扩展。
import glob #导入模块
for name in glob.glob(‘dir/*‘): #通配符(*)
for name in glob.glob(‘dir/file?.txt‘): #单字符通配符(?)
for name in glob.glob(‘dir/*[0-9].txt‘): #字符区间([a-z][0-9])
3. linecache(高效读取文本文件)
用途:从文件获取文本行,维护一个结果缓存,从而可以更高效地从相同文件读取多行文本。
linecache.getlines(filename)
# 从名为filename的文件中得到全部内容,输出为列表格式,以文件每行为列表中的一个元素,并以linenum-1为元素在列表中的位置存储
linecache.getline(filename,lineno)
#从名为filename的文件中得到第lineno行。这个函数从不会抛出一个异常–产生错误时它将返回”(换行符将包含在找到的行里)。如果文件没有找到,这个函数将会在sys.path搜索。
linecache.clearcache()
#清除缓存。如果你不再需要先前从getline()中得到的行
linecache.checkcache(filename)
#检查缓存的有效性。如果在缓存中的文件在硬盘上发生了变化,并且你需要更新版本,使用这个函数。如果省略filename,将检查缓存里的所有条目。
linecache.updatecache(filename)
#更新文件名为filename的缓存。如果filename文件更新了,使用这个函数可以更新linecache.getlines(filename)返回的列表。