Logistic回归
Logistic回归是一种经典的统计学分类方法,被广泛应用于生产环境中。本文主要介绍Logistic回归模型的原理以及参数估计、公式推导方法。
Sigmoid函数(Logistic函数)
Sigmoid函数的数学形式是:
f(x)=11+e−x
其函数图像如下:

其图形是一个S型曲线,关于(0,12)对称,取值在[0,1],因此可以作为一个概率分布。
Sigmoid函数的导数为:
f(x)′=−e−x(1+e−x)2=1(1+e−x)2(1−11+e−x)=f(x)(1−f(x))
Logistic模型
将线性函数的结果映射到Sigmoid函数中,得到Logistic模型。它是一种二分类模型,由条件概率P(Y|X)表示。随机变量X的取值为实数,Y的取值为{0,1}。Logistic模型如下:
P(Y=1|x)=11+e−θx
P(Y=0|x)=1−11+e−θx=e−θx1+e−θx
极大似然估计
设:
h(θ)=11+e−θx
则Logistic模型可表示为:
P(Y=y|x)=hθ(x)y(1−hθ(x))(1−y))
似然函数为:
L(θ)=∏hθ(x(i))y(i)(1−hθ(x(i))1−y(i))
对数似然函数为:
l(θ)=∑(y(i)loghθ(x(i))+(1−y(i))(1−loghθ(x(i))))
求
l(θ)的极大值,得到
θ的估计。
为了和线性回归保持一致,两边同时乘以
−1得到目标函数:
J(θ)=−∑(y(i)loghθ(x(i))+(1−y(i))(1−loghθ(x(i))))
求得
J(θ)的极小值
随机梯度下降法求解参数
对θ求偏导得:
∂J(θ)∂θj=−∑(y(i)1hθ(x(i))−(1−y(i))11−hθ(x(i)))∂∂θjhθ(x(i))=−∑(y(i)1hθ(x(i))−(1−y(i))11−hθ(x(i)))hθ(x(i)(1−hθ(x(i))∂θjθx=∑(hθ(x(i))−y(i))x(i)j
采用随机梯度下降法求参数的更新公式为:
θ:=θ−α(hθ(x(i))−y(i))x(i)j