series和dataframe的科学计算
series相加
series相加就是将对应index位置的values相加。
NaN和任何数做任何运算结果都为NaN。
dataframe加法
将dataframe想象成一个坐标系:
dataframe加法就是将相同坐标的值相加。
NaN和任何数做任何运算结果都为NaN。
dataframe内置的方法
按列或列求和sum
这里的一个特例是在按列求和过程中将自动忽略NaN
按行求和只需要指定axis=1即可:
按列或行求最大\最小值,max\min
dataframe信息describe
具体的输出如下:
count:本列的元素个数
mean:本列的平均数
std:标准差
min:最小值
25%:第一个四分卫数
50%:中位数
75%:第三个四分卫数
max:最大值
series和dataframe的排序
series排序
按照values排序
1、在排序后index也会随之进行调整
2、其中,在不指定参数的时候(即ascending=True)的时候,默认是一个升序排列。ascending=False表示降序排列
按照index排序
dataframe排序
按照column排序
这里指定了按A列进行升序排序。
降序排序也可以指定参数:ascending=False
按照index排序
降序:
dataframe的merge操作
merge的功能可以将多个dataframe进行连接。
merge的规则
以两个dataframe为例:merge的时候会先判断两个dataframe是否拥有相同的column,如果没有的话则无法merge。
merge的原则就是按相同的column进行连接,像下边这样:
之所以输出是一个空的dataframe,是因为相同的cloumn(key)中没有相同的values,所以merge就不能连接。
例如修改df2中的key列中的一个value为X,则将会将两个dataframe中key都为X的列连接在一起:
merge其他参数
on
on参数用于指定按哪一列进行merge,默认是None:
on=’key’即表示按照key这一列进行merge,on指定的merge的列必须是两个datafarme都有的列。
如果指定了data_set_1,那么将报错,因为data_set_1只是df1中才有的:
how
how参数指定了进行merge的方法,默认how=’inner’,表示按照两边都有的column进行merge。
how还可以指定的值比如:
left/right:表示按照左边/右边的dataframe进行merge,这样将保留指定位置dataframe的所有数据,而另一边则按照指定的这一边进行补全,空的部分为NaN
指定了left,即保留了df1的所有行和列数据,df2根据df1的行进行补全。
outer:这个参数相当于right和left的结合,即保留两边dataframe的所有行列,然后在补全空白。