Scalers 点评:在 2015 年,ScalersTalk 成长会完成 Python 小组完成了 《Python 核心编程》第 1 轮的学习。到 2016 年,我们开始第二轮的学习,并 且将重点放在章节的习题上。Python 小组是成长会内部小组,如果你想和我们 一起学习 Python,你需要是成长会成员,并且完成相关进群任务。
我们的节奏是行动是一周一章学到位,章节习题都会一个一个过。通过到位地 执行,达到实质性的提升。
本周学习情况
本周(20160314-20160320)学习第九章,章节内容为《文件》。本周复盘主 持人为 张丹荔。
本章主要内容
本章介绍了文件对象(内建函数、内建方法、属性), 标准文件, 访问文件系统的方法, 文件执行,初步认识持久存储和标准库中与文件有关的模块.
本章主要知识点
文件对象
定义:连续的字节序列,通常使用流的方式传输,流可以是单个字节也可以是大数据块。
文件及类文件:普通的磁盘文件, 而且也可以访问任何其它类型抽象层面上的”文件”,例如通过URL访问Web页面,或者网络通讯中的Socket.
文件内建函数
open
: 用于打开文件的内建函数open(filename, access_mode, buffering)
其中
access_mode
支持r
,w
,a
,U
四种模式,buffering
支持-1, 0, 1, 大于1的数字file
: 同open
函数功能相同,仅当需要通过上下文表示访问的是文件对象时,才需要考虑使用,否则一般使用open
即可。UNS
: 通用换行符,默认Python
中打开了对于通用换行符的支持,无论是哪个系统中使用的换行符,皆可以被识别,同时Python
中还提供了关闭该功能的方法——即--without-universal-newlines
来关闭该功能。
文件内建方法
读:
read, readline, readlines(size=-1, 0, n), next
写:
write(str), writelines(sequences)
位移:
seek(offset, whence=0,1,2), tell
关闭:
close
其它:
fileno, truncate(size), flush, isatty
文件内建属性
closed
: 是否关闭状态encoding
: 编码方式mode
: 打开方式name
: 文件名称newlines
: 换行符信息,若还没遇到换行符时,为None;若找到一个换行符,返回结果为字符串;若找到多个换行符,为换行符的列表
标准文件
Python
中只要程序一执行,就可以访问三个标准文件,分别如下:
sys.stdin
: 标准输入(一般是键盘)sys.stdout
: 标准输出(到显示器的缓冲输出)sys.stderr
: 标准错误(到屏幕的非缓冲输出)我们可以通过
sys
库拿到这三个文件的句柄,即可访问以上三个文件。此外,sys.*
对应的所有都是文件,都可以通过句柄来访问。
命令行参数
命令行参数即在执行Python
程序时,通过命令行输入的参数,类似shell
等在终端执行命令时输入的参数。这里采用了类似C
语言中的表示方法,即argv
.
argc
: 命令行参数的个数len(sys.argv)
argv
: 命令行参数的列表访问方式:
sys.argv
,返回一个存储了所有参数的列表,其中首个元素sys.argv[0]
是程序的名称,从sys.argv[1]
才开始表示输入的第一个参数,若输入只有一个参数时,推荐直接使用sys.argv[1]
来获取第一个参数;若输入参数较多时,推荐使用getopt
库获取命令行参数列表。
文件系统
访问方式:通过 os 模块来访问
os
模块对于文件及文件夹的操作:操作单个文件:
mkfifo/mknod, remove/unlink, rename/renames, tmpfile, walk
操作文件夹:
chdir/fchdir, chroot, listdir, mkdir/makedirs, rmdir/removedirs
调整权限:
access, chmod, chown/lchown, umask
文件描述符:
open, read/write
os.path
模块对于文件路径的操作:分隔:
basename, dirname, join, ……
信息:
getatime, getctime, getmtime, getsize
查询:
exists, isabs, isdir, ……
文件持久化存储相关库
序列化对象的库:
pickle/cPickle
序列化的库:pickle.dump(obj, file) 序列化 pickle.load(obj) 反序列化
anydbm
持久化存储的库:db = anydbm.open(filename, access_mode) //1
db[key_str] = value_str //2
db.close //3
db.items //4通过
key
和value
方式存储,仅仅支持存储字符串,即key
和value
都必须是字符串。shelve
库:结合了前两者的功能,既可以将任意
Python
对象序列化,同时还可以将其存储在文件或者内存中。使用方法类似anydbm
。
其它文件相关库
编码转换:
base64, binascii, uu
压缩解压:
gzip/zlib, bz2, tarfile, zipfile
高级文件访问:
shutil
其它:
tempfile, cStringIO
ScalersTalkID:scalerstalk
本微信公众号作者Scalers,游走在口译世界的IT从业者。微信公众号ScalersTalk,网站ScalersTalk.com,口译100小时训练计划群C 456036104
成长会是由Scalers发起的面向成长、实践行动,且凝聚了来自全球各地各行各业从业者的社群。有意入会者请和Scalers直接联系,我和其他会员会和你直接交流关于成长行动等各方面的经验教训。2016年成长会持续招募中,参见做能说会写的持续行动者:ScalersTalk成长会2016年会员计划介绍(2016.2更新)