文件和数据格式化之文件的使用
文件和数据格式化 的主要内容包括:1. 文件包括:文本文件和二进制文件
(1)文本文件一般由单一特定编码的字符组成
二进制文件直接由比特0和比特1组成。二进制是信息按照非字符但特定格式形成的文件,例如,png格式的图片文件、avi格式的视频文件。
(2)二进制文件和文本文件最主要的区别在于:
是否有统一的字符编码。
无论文件创建为文本文件或者二进制文件,都可以用“文本文件方式”和“二进制文件方式”打开,但打开后的操作不同。
f =open("a.txt","rt") #t表示文本文件方式
f = open(“a.txt”,“rb”) #b表示二进制文件方式
(3)采用文本方式读入文件,文件经过编码形成字符串,打印出有含义的字符;
采用二进制方式打开文件,文件被解析为字节流
(4)Python对文本文件和二进制文件采用统一的操作步骤,即“打开-操作-关闭”
(5)文件打开,读取的方法
文件打开后,对文件的读写有一个读取指针,当从文件中读入内容后,读取指针将向前进,再次读取的内容将从指针的新位置开始。
结合读取指针理解,上述代码中ls返回值为空,因为之前f.read()方法已经读取了文件全部内容,读取指针在文件末尾,再次调用f.readlines()方法已经无法从当前读取指针读入内容,因此返回结果为空。
f.seek()方法能够移动读取指针的位置,f.seek(0)将读取指针移动到文件开头,f.seek(2)将读取指针移动到文件结尾。
从文本文件中逐行读入内容并进行处理是一个基本的文件操作需求。文本文件可以看成是由行组成的组合类型,因此,可以使用遍历循环逐行遍历文件,使用方法如下:
f=open(name,'r')
for line in f:
#处理一行数据
f.close()
f.writelines(lines)直接将列表类型的各元素连接起来写入文件f。