1. 逻辑回归（Logistic）

用于解决二元分类问题

1. 二元分类

1. 介绍

从两个备选类中，将给定数据分到这两个类之中的一个类去。 [2019计算机视觉]——贪心学院学习笔记 2. 统计学基础 {逻辑回归}

1. 逻辑函数/模型（logit model）

Logit函数 $F(x) = \frac{1}{1+e^{-x}}$
[2019计算机视觉]——贪心学院学习笔记 2. 统计学基础 {逻辑回归}
取值：当f(x)≥0.5，取y = 1，否则取y = 0
注意观察Logit函数导数的样子

2. Logit与二元回归

我们可以将f(x)看作是“在给定输入x下，y=1的概率”即 $P(y = 1 | x)$
于是，可以得到 $P(y = 1 | x) = f( x ) = \frac{1}{1+e^{-(\theta_{0}+\theta_{1}x)}}$

3. 使用逻辑回归解决二元分类问题

$P(y = 1 | x; \theta) = f(x; \theta) = \frac{1}{1+e^{-\theta^{T}x}}$
解释：求训练得到的系数 $\theta$ ，给定x下y=1的概率。也就等于后面的 $\frac{1}{1+e^{-\theta^{T}x}}$
$\theta$ 为向量， $\theta = [\theta_{0}, \theta_{1},\theta_{2},...]$
$x$ 也向量， $x = [1, x{1},x{2},...]$ [^2]:X从1开始的原因是：线性拟合的的一个参数是 $1*\theta$
$\theta^{T}x = \sum_{i=0}\theta_{i}x_{i}$ (x0=1)

【实验】2.1 使用逻辑函数完成对购车的预测

2. 使用Logit进行预测的模型解释

1. 损失函数定义

$P(y = 1 | x; \theta) = f(x; \theta) = \frac{1}{1+e^{-\theta^{T}x}}$
损失函数： $J(\theta) = p = -\sum\limits_{n=1}^N[y^{(i)}ln(P(Y = 1|X = x^{(i)}; \theta)+(1-y^{(i)})ln(1-P(Y=1|X=x^{(i)};\theta))]$

2. 损失函数的解释

对于给定第i个模型的概率， $y^{i}$ 表示第i个数据为1，它乘以 $ln(P(Y = 1|X = x^{i}; \theta)$ 表示乘以在参数 $\theta$ 下 $x = x^{(i)}$ 的条件下 y为1的概率，如果猜测符合实际，这个值将会=0。同理，右边 $(1-y^{(i)})ln(1-P(Y=1|X=x^{(i)};\theta))]$ 在预测正确的情况下也会趋于0。故此，损失函数 $J(\theta)$ 较好的表示了预测值和真值的相差程度，因此将至用于度量模型的损失值。

3. 损失函数的特点

损失函数是凸函数，可导
$\triangledown_{\theta}J(\theta) = \sum\limits_{i}x^{(i)}(f(x^{(i)};\theta)-y^{(i)})$

4. 计算方式

随机初始化
计算梯度
梯度下降

5. Logit函数求梯度

(过程略)关键结论如下

$f(Z)' = (\frac{1}{1+e^{Z}})' = ...= f(Z)[ 1 - f(Z)]$
$l(\theta)=logL(\theta) = log(\prod\limits_{i=0}^ny_{i}P_{i}*\prod\limits_{i=0\equiv0}^n(1-y_{i})(1-P_{i}))$
$\frac{dln(\theta)}{d\theta}=\sum\limits_{i=1}^N(y_i - P_i)x_i$
$log(L(\theta))$ 为期望，我们需要最大化期望，这需要梯度上升法。为满足一般使用梯度下降法的习惯，故取 $loss(\theta)=-l(\theta)$ 。由此，对loss求 $\theta$ 求导就为 $\frac{\partial loss(\theta))}{\partial \theta} = \sum\limits_{i=1}^N(P_i-y_i)x$

[2019计算机视觉]——贪心学院 学习笔记 2. 统计学基础 {逻辑回归}

文章目录