Pandas学习
要使用pandas,首先需要了解他主要两个数据结构:Series和DataFrame。
pycharm安装pandas:https://blog.****.net/yj928674542/article/details/75172182
Series
的字符串表现形式为:索引在左边,值在右边。由于我们没有为数据指定索引。于是会自动创建一个0到N-1(N为长度)的整数型索引。
DataFrame
是一个表格型的数据结构,它包含有一组有序的列,每列可以是不同的值类型(数值,字符串,布尔值等)。DataFrame
既有行索引也有列索引, 它可以被看做由Series
组成的大字典。
iloc[0,1]=np.nan 我的理解就是各加1,并赋值。np.nan就是把矩阵中的值设置为空。
#concat纵向合并
res = pd.concat([df1, df2, df3], axis=0)
要点
pandas
中的merge
和concat
类似,但主要是用于两组有key column的数据,统一索引的数据. 通常也被用在Database的处理当中.
merge主要用在两组多维矩阵中和合并。
inner和outer是合并方式。合并时有4种方法how = ['left', 'right', 'outer', 'inner']
,预设值how='inner'
。