LR模型推导

1、定义

二项逻辑斯谛回归模型,是如下的条件概率分布。

(1)P(Y=1|x)=ewx1+ewx

(2)P(Y=0|x)=11+ewx

注意,这里为了方便已经将b扩充入w。公式(2)可以看做11+ez,(Sigmoid函数)如下图
LR模型推导

2、事件的几率

指的是事件发生的概率与该事件不发生的概率的比值。假设事件发生的概率是p,那么该事件的几率是p1p,对于逻辑斯谛回归模型而言,事件几率取log如下:

logP(Y=1|x)1P(Y=0|x)=wx

3、模型参数估计

假设:P(Y=1|x)=π(x),P(Y=0|x)=1π(x)
似然函数:

(3)i=1N[π(xi)]yi[1π(xi)]1yi

公式(3)表明,对于正样本而言,右边的项为1,对于负样本而言,左边的项为1。即满足所有样本的概率最大。
对数似然函数:
(4)L(w)=i=1N[yilogπ(xi)+(1yi)log(1π(xi))]=i=1N[yilogπ(xi)1π(xi)+log(1π(xi))]=i=1N[yi(wxi)log(1+ewxi)]

如公式(4)所示,求解的是最大值问题,可以用梯度下降法(这里求最大值,实际是梯度上升,或者加负号变成梯度下降法)等优化方法求解参数w
假设求得参数w^。代入公式(1)(2)即可得模型。