Logistic回归(理论篇)

Logistic回归

Logistic回归是一种经典的统计学分类方法,被广泛应用于生产环境中。本文主要介绍Logistic回归模型的原理以及参数估计、公式推导方法。

Sigmoid函数(Logistic函数)

Sigmoid函数的数学形式是:

f(x)=11+ex

其函数图像如下:
Logistic回归(理论篇)
其图形是一个S型曲线,关于(0,12)对称,取值在[0,1],因此可以作为一个概率分布。
Sigmoid函数的导数为:

f(x)=ex(1+ex)2=1(1+ex)2(111+ex)=f(x)(1f(x))

Logistic模型

将线性函数的结果映射到Sigmoid函数中,得到Logistic模型。它是一种二分类模型,由条件概率P(Y|X)表示。随机变量X的取值为实数,Y的取值为{0,1}。Logistic模型如下:

P(Y=1|x)=11+eθx

P(Y=0|x)=111+eθx=eθx1+eθx

极大似然估计

设:

h(θ)=11+eθx

则Logistic模型可表示为:
P(Y=y|x)=hθ(x)y(1hθ(x))(1y))

似然函数为:
L(θ)=hθ(x(i))y(i)(1hθ(x(i))1y(i))

对数似然函数为:
l(θ)=(y(i)loghθ(x(i))+(1y(i))(1loghθ(x(i))))

l(θ)的极大值,得到θ的估计。
为了和线性回归保持一致,两边同时乘以1得到目标函数:
J(θ)=(y(i)loghθ(x(i))+(1y(i))(1loghθ(x(i))))

求得J(θ)的极小值

随机梯度下降法求解参数

θ求偏导得:

J(θ)θj=(y(i)1hθ(x(i))(1y(i))11hθ(x(i)))θjhθ(x(i))=(y(i)1hθ(x(i))(1y(i))11hθ(x(i)))hθ(x(i)(1hθ(x(i))θjθx=(hθ(x(i))y(i))xj(i)

采用随机梯度下降法求参数的更新公式为:
θ:=θα(hθ(x(i))y(i))xj(i)