机器学习-线性回归python实践【1】

写在最前面:
线性回归是机器学习最简单的模型,用来寻找最佳拟合曲线。我曾经在数模比赛时用过,虽然只拿了省二。
优点是:易于理解,计算简单
缺点是:对于非线性的数据拟合效果不好
适用数据类型:数值型和标称型数据

今天简单介绍下最小二乘法(ordinary least squares)
机器学习-线性回归python实践【1】
这是一组样例数据的的散点图,目的很简单,得到该组数据的最佳拟合曲线

机器学习-线性回归python实践【1】

第一个函数打开用tab键分隔的文本文件,文件的每一行的最后是目标值。
第二个函数用来计算最佳拟合曲线,首先读x,y的值,并且保存到矩阵中去,然后计算x^T *x ,判断行列式非0,如果此时不判断行列式非0,取逆的时候会有问题。
对了,这是最小二乘法的公式
机器学习-线性回归python实践【1】

目的是求出β,y=x ✖️ β
就是这么简单,只是个入门而已啦,复杂的等我后面研究了再分享
Go on

将数据点升序排列,然后绘制数据集散点图和最佳拟合曲线
机器学习-线性回归python实践【1】
机器学习-线性回归python实践【1】

写在最后:Numpy库提供了相关系数的计算方法corrcoef计算预测值和真实值得相关性:大概是0.98的样子
机器学习-线性回归python实践【1】

今天就到这里,各位晚安。