逻辑回归-多类别分类

什么是多类别问题

比如区分邮件,用以区分来自朋友的邮件,来自家人的邮件和工作邮件。
比如区分天气,区分晴天,雨天,多云,小雪。这就是多类别问题。

二元分类和多类别

之前我们用逻辑回归来解决了二元分类问题,如预测肿瘤的恶/良性,我们的做法是将数据集分为正类和负类。
多类别分类思想类似,比如我们有个三元类,需要区分三角形,正方形和圆形。
我们的做法是,将三元类拆成三个独立得二元分类,将三角形作为正样本1,其他为0。

逻辑回归-多类别分类

i=1三角形
i=2正方形
i=3圆形
h是我们的逻辑回归分类器。

我们的目的是,训练一个逻辑回归分类器,来预测i类别y=i得概率。

如上图,给出一个新的输入值x,为了获得预测,在三个分类器中运行输入x,然后选择h最大得类别,也就是让选择分类器,选择出三个中效果最好,可信度最高得分类器。
无论i是多少,我们都能找出最高的概率值,就是我们预测得y