机器学习--数据科学包(一)numpy&pandas
机器学习–数据科学包(一)
初识numpy & pandas
加速计算,pandas可认为numpy升级版
一、numpy安装
https://pypi.org/project/numpy/#files
翻看很多博客才成功安装,慢慢整吧,以上是下载地址
二、numpy属性
矩阵的定义:
np.array([[1,2,3],[2,3,4]])
输出矩阵维度:
.ndim
输出矩阵形状:
.shape
输出矩阵元素数量
.size
三、numpy创建array
设置矩阵类型:.array([],dtype=np.int/int32/float)
输出矩阵数据类型:.dtype
零矩阵:.zeros((3,4))
1矩阵:.ones((3,4),dtype=np.int16)
空矩阵:.empt
生成有序数列:.arange(起始数,终止数,步长) .arange(12).reshape((3,4)) 从0到12,3行4列
生成固定段数的数列: .linspace(起始值,终止值,段数)
随机生成一定规模的矩阵: .random.random((2*4))
四、numpy基础运算
±*/
矩阵乘法:
表达形式一:.dot(a,b) 表达形式二:a.dot(b)
求和:.sum() .sum(a,axis=0)对a矩阵列求和 axis=1行求和
求最小值:.min()
求最大值:max()
五、numpy基础运算(二)
最小值索引:.argmin()
最大值索引:argmax()
平均值:.mean()/ .average()
中位数:.median()
累加:.cumsum()
累差:.diff()
输出非零:.nonzero()
排序:.sort()
转置:.transpose()
截取:.clip(a,5,9)矩阵a小于5的部分替换为5,大于9的部分替换为9
六、numpy索引
索引某一位置:a[ ][ ]或a[ , ]
迭代每一行:for row in A:print(row)
索引每一列:for column in A.T: print(column)
七、numpy的array合并
矩阵的上下合并: .vstack(A,B)
矩阵的左右合并: .hstack(A,B)
横向序列变为竖向序列:np.newaxis
多个矩阵合并:上下合并np.concatenate((A,B,B,A),axis=0)
八、numpy的array分割
将A矩阵按列分为2块:.split(A,2,axis=1)
不等项分割:array_split
纵向分割:.vsplit
横向分割:.hsplit
九、numpy的copy & deep copy
赋值但不关联