Python数据分析-NumPy数据存取

数据的CSV文件存取

CSV是一种常见的文件格式,用来存储批量数据
np.savatxt(frame,array,fmt=’%.18e’,delimiter=None)

  • frame:文件、字符串或产生器,可以是.gz或.bz2的压缩文件
  • array:存入文件的数组
  • fmt:写入文件的格式,例如%d %.2f %.18e
  • delimiter:分割字符串、默认是任何空格

np.loadtxt(frame,dtype=np.float,delimiter=None,uunpack=False)

  • frame:文件、字符串或产生器,可以是.gz或.bz2的压缩文件
  • dtype:数据类型,可选
  • delimiter:分割字符串,默认是任何空格
  • unpack:如果是True,读入属性将分别写入不同变量

CSV文件的局限性

CSV只能有效存储一维和二维数据

多维数据的存取

a.tofile(frame,sep=’’,format=’%s’)

  • frame:文件、字符串
  • sep:数据分割字符串,如果是空串,写入文件为二进制
  • format:写入数据的格式

np.fromfile(frame,dtype=float,count=-1,sep=’’)

  • frame:文件、字符串
  • type:读取的数据类型
  • count:读入元素个数,-1表示读入整个文件
  • sep:数据分割字符串,如果是空串,写入文件为二进制
    注意点:使用.fromfile()需要知道数组的维度和元素类型
    Python数据分析-NumPy数据存取

NumPy的便捷文件存取

np.save(fname,array)或np.savez(fname,array)

  • frame:文件名,以.npy为扩展名,压缩扩展名为.npz
  • array:数组变量

np.load(fname)

  • fname:文件名,以.npy为扩展名,压缩扩展名为.npz

注意点:此时使用.load()会自动按照维度信息排列
Python数据分析-NumPy数据存取