【机器学习算法】:朴素贝叶斯法

我们用极大似然估计参数的原因是因为我们只知道数据集D和模型,单若是在建模之前就呢个获得额外信息,即先验概率P(w),可以通过这个先验知识简历更加精准的模型。所以当我们认为先验概率P(w)为均匀分布,等于1时最大后验估计与极大似然估计等价。
朴素贝叶斯法是基于贝叶斯定理的分类方法。

朴素贝叶斯分类

朴素贝叶斯法之所以叫朴素,因为其做了一个较强的假设,该假设为:用于分类的特征,在类确定的条件下,都是独立分布的。
李航的统计学习方法中是如下介绍朴素贝叶斯分类原理的~
【机器学习算法】:朴素贝叶斯法

上述方法中提到,需要我们最大化后验概率,得到最后的结果

后验概率最大化的含义

也就是等价于期望风险最小化。

朴素贝叶斯算法整体流程

0.输入训练数据集
1.计算先验概率和条件概率
2.利用贝叶斯定理计算后验概率(只计算分子部分,因为对于每个实例分母部分都一样)
3.将给定实例分到后验概率最大的类中
【机器学习算法】:朴素贝叶斯法

朴素贝叶斯算法简单举例

【机器学习算法】:朴素贝叶斯法
【机器学习算法】:朴素贝叶斯法