一、数据

(x⁽¹⁾,y⁽¹⁾),(x⁽¹⁾,y⁽¹⁾),…,(x^(m),y^(m))
x⁽ⁱ⁾是n维向量, y⁽ⁱ⁾是连续实数
向量全是列向量

二、假设函数h

基础线性回归
设x^(j)₀=0为恒为1,得到向量表示

此时x⁽ⁱ⁾为n+1维向量，下标为0~n

三、损失函数

（1）MSE(均方误差)

基础线性回归

（2）直观的感觉

基础线性回归
所有实际值与预测值距离的平方和

（3）为什么是均方误差

首先假设目标变量和输入值存在下面这种等量关系：
基础线性回归
最右边一项为误差，由多个因素共同导致，每一个因素就是一个分布，由中心极限定理可得,这一项误差满足高斯分布,概率密度函数为：

y⁽ⁱ⁾是误差加上预测项，则y⁽ⁱ⁾与误差同分布，就是均值需要改变

假设每个样本独立，极大化似然函数
基础线性回归
将其中的常量去掉，添加负号，那么我们就是要最小化下面这个式子：