Python数据分析-NumPy数据存取
数据的CSV文件存取
CSV是一种常见的文件格式,用来存储批量数据
np.savatxt(frame,array,fmt=’%.18e’,delimiter=None)
- frame:文件、字符串或产生器,可以是.gz或.bz2的压缩文件
- array:存入文件的数组
- fmt:写入文件的格式,例如%d %.2f %.18e
- delimiter:分割字符串、默认是任何空格
np.loadtxt(frame,dtype=np.float,delimiter=None,uunpack=False)
- frame:文件、字符串或产生器,可以是.gz或.bz2的压缩文件
- dtype:数据类型,可选
- delimiter:分割字符串,默认是任何空格
- unpack:如果是True,读入属性将分别写入不同变量
CSV文件的局限性
CSV只能有效存储一维和二维数据
多维数据的存取
a.tofile(frame,sep=’’,format=’%s’)
- frame:文件、字符串
- sep:数据分割字符串,如果是空串,写入文件为二进制
- format:写入数据的格式
np.fromfile(frame,dtype=float,count=-1,sep=’’)
- frame:文件、字符串
- type:读取的数据类型
- count:读入元素个数,-1表示读入整个文件
- sep:数据分割字符串,如果是空串,写入文件为二进制
注意点:使用.fromfile()需要知道数组的维度和元素类型
NumPy的便捷文件存取
np.save(fname,array)或np.savez(fname,array)
- frame:文件名,以.npy为扩展名,压缩扩展名为.npz
- array:数组变量
np.load(fname)
- fname:文件名,以.npy为扩展名,压缩扩展名为.npz
注意点:此时使用.load()会自动按照维度信息排列