1 什么是线性回归

线性回归是利用数理统计中回归分析，来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法，运用十分广泛。
其表达形式为y = ax+b，a为误差服从均值为0的正态分布。
一元线性回归分析：只包括一个自变量和一个因变量，且二者的关系可用一条直线近似表示。
多元线性回归分析：如果回归分析中包括两个或两个以上的自变量，且因变量和自变量之间是线性关系。

2线性回归的原理

线性回归假设特征和结果满足线性关系。通过一个映射函数将特征变量与预测结果形成关系。这样就可以表达特征与结果之间的非线性关系。这样可以写出一个估计函数：
机器学习之-线性回归学习笔记
其中θ为权重参数，具体含义为所点成的特征变量在整个变量中所占的比重，比重越大，该特征的影响力越大，在实际应用中越值得考虑。

3 线性求解思路

3.1 损失函数

在简单线回归问题中，模型就是我们的直线方程：y = ax + b 。
要想最大的拟合数据，本质上就是找到没有拟合的部分，也就是损失的部分尽量小。损失函数（loss function）定义为：
机器学习之-线性回归学习笔记
因此我们目标是：已知训练数据样本x、y ，找到a和b的值，使损失函数尽可能小，从而得出最佳的拟合方程。
通过分析问题，确定问题的损失函数或者效用函数；通过最优化损失函数或者效用函数，获得机器学习模型。
在很多机器学习的模型中，都是这种原理，比如线性回归、多项式回归、逻辑回归、SVM、神经网络等。