Pandas DataFrame二维数组说明、DataFrame的创建、从文件中读取DataFrame对象知识---初学基础

1.DataFrame说明

DataFrame是一个【表格型】的数据结构,可以看做是【由Series组成的字典】(共用同一个索引)。DataFrame由按一定顺序排列的多列数据组成,设计初衷是将Series的使用场景从一维拓展到多维,DataFrame既有行索引,也有列索引,DataFrame属性:values、columns、index、shape。

  • 行索引:index
  • 列索引:columns
  • 值:values(numpy的二维数组)
2.DataFrame的创建

直接创建:
Pandas DataFrame二维数组说明、DataFrame的创建、从文件中读取DataFrame对象知识---初学基础
Pandas DataFrame二维数组说明、DataFrame的创建、从文件中读取DataFrame对象知识---初学基础
使用字典创建:
Pandas DataFrame二维数组说明、DataFrame的创建、从文件中读取DataFrame对象知识---初学基础

3.从文件中读取DataFrame对象

pandas.read_excel(io,sheet_name = 0,header = 0,names = None,index_col = None,usecols = None,squeeze = False,dtype = None, …)
io:字符串,文件的路径对象;
sheet_name:None、string、int、字符串列表或整数列表,默认为0。字符串用于工作表名称,整数用于零索引工作表位置,字符串列表或整数列表用于请求多个工作表,为None时获取所有工作表;
header:指定作为列名的行,默认0,即取第一行的值为列名。数据为列名行以下的数据;若数据不含列名,则设定 header = None;
names:默认为None,要使用的列名列表,如不包含标题行,应显示传递header=None;
index_col:指定列为索引列,默认None列(0索引)用作DataFrame的行标签;
usecols:int或list,默认为None;
squeeze:boolean,默认为False,如果解析的数据只包含一列,则返回一个Series;
dtype:列的类型名称或字典,默认为None。数据或列的数据类型。例如{‘a’:np.float64,‘b’:np.int32}使用对象保存存储在Excel中的数据而不解释dtype。如果指定了转换器,则它们将应用于dtype转换的INSTEAD;
skiprows:省略指定行数的数据,从第一行开始;
skipfooter:省略指定行数的数据,从尾部数的行开始;
dtype:字典类型{‘列名1’:数据类型,‘列名’:数据类型},设定指定列的数据类型;
创建一个myname.xlsx的文件:两个工作表
Pandas DataFrame二维数组说明、DataFrame的创建、从文件中读取DataFrame对象知识---初学基础
Pandas DataFrame二维数组说明、DataFrame的创建、从文件中读取DataFrame对象知识---初学基础
取第一个工作表的内容:
Pandas DataFrame二维数组说明、DataFrame的创建、从文件中读取DataFrame对象知识---初学基础
取第二个工作表的内容:
Pandas DataFrame二维数组说明、DataFrame的创建、从文件中读取DataFrame对象知识---初学基础
注:1.index_col 默认值(index_col = None)——重新设置一列成为index值
2.index_col=False——重新设置一列成为index值
3.index_col=0——第一列为index值,index_col=0,将第一列变为index。
4.index_col 以哪一列作为行索引,header 指定哪一行作为列索引,sheet_name 可以设置工作表的索引或名称

4.使用Series构造DataFrame

Pandas DataFrame二维数组说明、DataFrame的创建、从文件中读取DataFrame对象知识---初学基础

编者寄:文章面向小白也可能会被行业前辈看到,为避免知识误导,若文章有错误,还请过路朋友指出,末学好及时更正,评论区见~
整理于学习资料,比心图片来源网络;
Pandas DataFrame二维数组说明、DataFrame的创建、从文件中读取DataFrame对象知识---初学基础