series和dataframe的科学计算

series相加


series相加就是将对应index位置的values相加。
series和dataframe的科学计算

NaN和任何数做任何运算结果都为NaN。

dataframe加法


将dataframe想象成一个坐标系:
dataframe加法就是将相同坐标的值相加。
series和dataframe的科学计算

NaN和任何数做任何运算结果都为NaN。

dataframe内置的方法


按列或列求和sum

series和dataframe的科学计算

这里的一个特例是在按列求和过程中将自动忽略NaN

按行求和只需要指定axis=1即可:
series和dataframe的科学计算

按列或行求最大\最小值,max\min

series和dataframe的科学计算

dataframe信息describe

series和dataframe的科学计算

具体的输出如下:
count:本列的元素个数
mean:本列的平均数
std:标准差
min:最小值
25%:第一个四分卫数
50%:中位数
75%:第三个四分卫数
max:最大值

series和dataframe的排序


series排序

按照values排序

series和dataframe的科学计算

1、在排序后index也会随之进行调整
2、其中,在不指定参数的时候(即ascending=True)的时候,默认是一个升序排列。ascending=False表示降序排列

按照index排序

series和dataframe的科学计算

dataframe排序

按照column排序

series和dataframe的科学计算

这里指定了按A列进行升序排序。

降序排序也可以指定参数:ascending=False
series和dataframe的科学计算

按照index排序

series和dataframe的科学计算

降序:
series和dataframe的科学计算

dataframe的merge操作


merge的功能可以将多个dataframe进行连接。

merge的规则

以两个dataframe为例:merge的时候会先判断两个dataframe是否拥有相同的column,如果没有的话则无法merge。
series和dataframe的科学计算

merge的原则就是按相同的column进行连接,像下边这样:
series和dataframe的科学计算

之所以输出是一个空的dataframe,是因为相同的cloumn(key)中没有相同的values,所以merge就不能连接。

例如修改df2中的key列中的一个value为X,则将会将两个dataframe中key都为X的列连接在一起:
series和dataframe的科学计算

merge其他参数

on

on参数用于指定按哪一列进行merge,默认是None:
series和dataframe的科学计算

on=’key’即表示按照key这一列进行merge,on指定的merge的列必须是两个datafarme都有的列。

如果指定了data_set_1,那么将报错,因为data_set_1只是df1中才有的:
series和dataframe的科学计算

how

how参数指定了进行merge的方法,默认how=’inner’,表示按照两边都有的column进行merge。

how还可以指定的值比如:

left/right:表示按照左边/右边的dataframe进行merge,这样将保留指定位置dataframe的所有数据,而另一边则按照指定的这一边进行补全,空的部分为NaN
series和dataframe的科学计算

指定了left,即保留了df1的所有行和列数据,df2根据df1的行进行补全。

outer:这个参数相当于right和left的结合,即保留两边dataframe的所有行列,然后在补全空白。
series和dataframe的科学计算