贝叶斯分类器

本文摘抄自《机器学习》一书，作者：周志华

贝叶斯分类器

对分类任务来说，在所有相关概率都已知的理想条件下，贝叶斯决策论考虑如何基于这些概率和误判损失来选择最优的类别标记。以多分类任务为例进行解释。

假设有N种可能的类别标记（好瓜或者坏瓜等类别），即贝叶斯分类器，是将一个真实分类为的样本误分类为所产生的损失。基于后验概率可获得将样本x分类为所产生的期望损失，即在样本x上的条件风险：

贝叶斯分类器

因此我们需要寻找一个判定准则h，以最小化总体风险：

贝叶斯分类器

显然，对于每个样本x，若h能最小化条件风险贝叶斯分类器，则总体风险也将被最小化。这就产生了贝叶斯准则：为最小化总体风险，只需在每个样本上选择那个能使条件风险最小的类别标记，即：

贝叶斯分类器

此时贝叶斯分类器称为贝叶斯最优分类器，与之对应的总体风险称为贝叶斯风险。

具体来说，若目标是最小化分类错误率，则误判损失贝叶斯分类器可写为，此时条件风险为：

贝叶斯分类器

于是，最小化分类错误率的贝叶斯最优分类器为：

贝叶斯分类器

因此，想要使用贝叶斯判定准则来最小化决策风险，首先要获取后验概率贝叶斯分类器。然而在现实任务中这通常难以直接获得。从这个角度来看，机器学习所要实现的是基于有限的训练样本尽可能准确的估计出后验概率。总体来说，主要有两种策略：给定x，可通过直接建模来预测c，这样得到的是“判别式模型”（决策树、BP神经网络、支持向量机）。也可先对联合概率分布建模，然后再由此获得，这样得到的是“生成式模型”（贝叶斯）。接下来我们介绍生成式模型：

贝叶斯分类器

基于贝叶斯定理，贝叶斯分类器可写为：

贝叶斯分类器

其中，贝叶斯分类器是类（即类别，如好瓜、坏瓜等）先验概率，是样本x相对于类标记c的类条件概率，或称为“似然”。是用于归一化的证据因子，对给定样本x，证据因子与类标记无关。因此估计的问题就转化为如何基于训练数据D来估计先验概率和似然。

类先验概率贝叶斯分类器表达了样本空间中各类样本所占的比例，根据大数定律，当训练集包含充足的独立同分布样本时，可通过各类样本出现的频率进行估计。对类条件概率来说，由于他涉及关于x所有属性的联合概率，直接根据样本出现的频率进行估计将会遇到严重的困难，因此我们使用极大似然估计，具体介绍可参看我的另一篇博客。