python merge()&groupby()
以下内容简单介绍merge和groupby在数据处理时常用的形式。
1.merge()
使用方法一:
merge(df1,df2,on=’key’,how=’left’)
======================================================================================
df1,df2:
要混合的两个dataframe,
on:
混合关键词列,
how:
混合方式。
left:
以左边dataframe为标准按左边dataframe标准去搜索右边的dataframe。
======================================================================================
搜索流程:
①确定左边dataframe的key。
②按键搜索右边dataframe。
③列出。
======================================================================================
使用方法二:
A=A.merge(B,how=’left’,on=[])
A为混合主体,on指定一组列作为key。
注:由于合并后常常存在空值NaN,因此常与fillna(x)函数联用,其中x代表要填充进NaN的值。
======================================================================================
gruopby():
df.grouby([‘column1’,’column2’])[‘column3’].func()
根据func指定处理形式合并df中含有相同[‘column1’,’column2’]的行。
[‘column3’]表被无视的一列,最后变为‘’计数‘’列。
另外,可以使用apply()函数使运用更加灵活。
注:合并时无视df中其他的列。