分类算法classification problem
- 逻辑回归logistic regression

分类算法（classification problem）

逻辑回归（logistic regression）

hypothesis：

h θ (x) = g (θ T x) g (z) = 1 1 + e - z

g(z)被称作S型函数（sigmoid function）或者逻辑函数（logistic function），函数图像如图所示，过(0,0.5)点，正无穷趋于1，负无穷趋于0。

分类问题-机器学习（machine learning）笔记（Andrew Ng）

实际上，这个假设函数计算的是P(y=1|x;θ)，即给定x的条件下，y=1的概率，然后我们使得

y = {1, 0, i f i f h θ (x) \geq 0.5 h θ (x) < 0.5 n o w n o w θ T x \geq 0 θ T x < 0

其中 θTx=0 或者 hθ(x)=0.5 被称为决策边界（decision boundary），易见θ 确定下来后，决策边界也会确定下来。
在线性回归中用到的两种拟合的方法也可以用在这里：

线性 hθ(x)=g(θ0+θ1∗x1+θ2∗x2)
多项式 hθ(x)=g(θ0+θ1∗x1+θ2∗x2+θ3∗x21+θ4∗x22)

cost function

J (θ) = 1 m \sum i = 1 m C o s t (h θ (x (i)), y (i)) C o s t (h θ (x), y) = {- log (h θ (x)) - log (1 - h θ (x)) i f i f y = 1 y = 0

如果hθ(x)趋向于1的时候， y 的预测值应当取作1，所以此时 y=1 的时候，Cost 函数应当尽可能的小。当hθ(x)取到1的时候，Cost=0 。
如果hθ(x)趋向0的时候，y的预测值应当取做0，但是如果此时y=1，说明我们的算法很烂，Cost应该尽可能大。当hθ(x)趋向0的时候，Cost趋向于无穷。
对y=0的分析相似。
我们可以简化Cost：

C o s t (h θ (x), y) = - y log (h θ (x)) - (1 - y) log (1 - h θ (x))

所以最后的cost function为：

J (θ) = - 1 m [\sum i = 1 m y (i) log h θ (x (i)) + (1 - y (i)) log (1 - h θ (x (i)))]

todo 这个式子是从极大似然估计而来的
为了得到θ的估计值，我们可以使用梯度下降，更新的过程如下：

θ j : = θ j - α \sum i = 1 m (h θ (x (i)) - y (i)) x (i) j

关于这个式子的得到仍然是对代价函数J(θ)求偏导，以求能够找到以步伐α最快“下山”的路径。
求导过程：
分类问题-机器学习（machine learning）笔记（Andrew Ng）

分类问题-机器学习（machine learning）笔记（Andrew Ng）

分类算法（classification problem）

逻辑回归（logistic regression）

相关推荐