线性回归公式推导总结

1.预测函数:

线性回归公式推导总结

2.代价函数:

  • 假设每一个对象的预测值与真实值的误差为ε,即:

线性回归公式推导总结
则由中心极限定理可知:

  • 当样本数量很多时,可假设误差ε的分布符合均值μ=0,方差为σ^2的高斯分布,即:

线性回归公式推导总结

  • 现在的任务是在所有可能的θ中,寻找一个最适合的θ,使得误差ε呈高斯分布的可能性最大,则由似然函数有:
    线性回归公式推导总结

  • 对等式两边同时取对数求极大似然,即:

线性回归公式推导总结

  • 综上,代价函数为:
    线性回归公式推导总结

三、梯度下降:

  • 先给出梯度下降的结论:

线性回归公式推导总结

  • 如果能求出虚线框内的偏导数,则可以顺利完成梯度下降:

线性回归公式推导总结

  • 综上,梯度下降的公式为:

线性回归公式推导总结

  • 一般的,如果每更新一个参数,都要遍历一次全部数据的话,耗时太长,所有有了随机梯度下降,即每更新一个参数,只选用一个对象对应特征去更新(省时,但效果不如前者):
    线性回归公式推导总结

四、正规方程:

  • 使用梯度下降寻找最优参数比较耗时,所以当数据集的特征X符合:X的转置*X存在逆矩阵时,可采用正规方程迅速找出最优参数,即:

线性回归公式推导总结

  • 下面给出两种推导方法:
  • 推导方法一:
    线性回归公式推导总结
  • 推导方法二(比较取巧):
    线性回归公式推导总结