一. 类别

1. 有监督学习

包括分类，回归等问题模型。

简单来说，在有监督学习中，所有的数据都会被打上标签，基于已知的数据集，进行训练，然后使用训练好的模型去预测未知的数据集的结果。

2. 无监督学习

包括聚类，关联规则等问题模型。

无监督学习中的数据是没有标签的，只能通过一些计算去学习一些未知的知识。比如聚类算法中依靠计算距离最近的点，将其分为自己那一类。这个过程是自己学的，数据本身并没有告诉他每一个点属于哪一个类别。

二. 线性回归算法

如下图所示，我们以下图的场景进行举例

机器学习【1】：机器学习类别，线性回归

我们想知道额度（y）与工资（theta1）和年龄（theta2）之间究竟有何线性关系，首先我们要列出线性方程。这个读过高中应该都不难。

机器学习【1】：机器学习类别，线性回归

其中theta0是一个偏向，类似于y = wx+b中的b

那么，我们想要通过线性回归去不断求出最好的theta值，我们需要构建它的损失函数

线性模型下1个二维样本点的MSE损失为（以y=wx+b为例，没什么差别，就是少了个参数，方便一点）：

机器学习【1】：机器学习类别，线性回归

线性模型下N个二维样本点的MSE损失为：

机器学习【1】：机器学习类别，线性回归

其中，wx+b 是我们所定的线性回归方程，这个方程的w和b的值是需要不断去更新的，具体如何更新接下来我们会说。我想说，真实值y我们是知道的，那么我们的w和b怎么样是最好的呢？是wx+b的值和真实的y值之间的差要尽可能小，这样证明我们拟合的曲线是正确的。所以现在就变成了求f(w,b) = wx+b - y这个方程的最小值。（x,y）值我们都是有的，这就是线性回归的本质思想。关键就在于，损失函数f出来之后，你要立马反应出来这是一个关于w,b的函数，而不是x,y的函数。

我们更新w,b参数的方式采用的就是机器学习中经典的梯度下降算法。将在下一篇博客中给出。

机器学习【1】：机器学习类别，线性回归

一. 类别

1. 有监督学习

2. 无监督学习

二. 线性回归算法

相关推荐