模式识别_2_基于贝叶斯决策理论的分类器

2.1 引言

 以特征值的统计概率为基础
给定M个类(模式识别_2_基于贝叶斯决策理论的分类器)的分类任务和一个用特征向量x表示的样本,生成一系列条件概率(后验概率)
        
       模式识别_2_基于贝叶斯决策理论的分类器 表示特征向量属于某一特定类模式识别_2_基于贝叶斯决策理论的分类器的概率

2.2 贝叶斯决策理论

 先验概率:模式识别_2_基于贝叶斯决策理论的分类器模式识别_2_基于贝叶斯决策理论的分类器样本总数,模式识别_2_基于贝叶斯决策理论的分类器第i类样本数(每个类中样本的占比)
类条件(概率密度函数or概率):模式识别_2_基于贝叶斯决策理论的分类器 描述一类中特征向量的分布情况,相对于x的模式识别_2_基于贝叶斯决策理论的分类器的似然函数

则我们很容易表示
模式识别_2_基于贝叶斯决策理论的分类器,比较这个概率的大小选择大的类
 如果,先验概率相等,即模式识别_2_基于贝叶斯决策理论的分类器=1/2,则最大估计值只取决于x的条件概率密度函数的估计值,如下图:
模式识别_2_基于贝叶斯决策理论的分类器
模式识别_2_基于贝叶斯决策理论的分类器处虚线将特征空间分成两个区域模式识别_2_基于贝叶斯决策理论的分类器模式识别_2_基于贝叶斯决策理论的分类器。对于模式识别_2_基于贝叶斯决策理论的分类器区的所有x值,分类器判断属于模式识别_2_基于贝叶斯决策理论的分类器;对于模式识别_2_基于贝叶斯决策理论的分类器区的所有x值,分类器判断属于模式识别_2_基于贝叶斯决策理论的分类器。但错误无法避免,在阴影面积内的x值有一定几率判断错误。错误率模式识别_2_基于贝叶斯决策理论的分类器 :
模式识别_2_基于贝叶斯决策理论的分类器
对概率加权(反映不同类型错误对总错误率的贡献程度)后,定义平均风险:
模式识别_2_基于贝叶斯决策理论的分类器
谁上述表达式一般化,对一个M类问题,属于模式识别_2_基于贝叶斯决策理论的分类器的特征向量x位于模式识别_2_基于贝叶斯决策理论的分类器产生错误。没一个这样的情况出现惩罚系数模式识别_2_基于贝叶斯决策理论的分类器(也称损失),组成的矩阵称为L损失矩阵(对角线上模式识别_2_基于贝叶斯决策理论的分类器对应正确的决策,设为0)。则与第k类模式识别_2_基于贝叶斯决策理论的分类器风险定义为:
模式识别_2_基于贝叶斯决策理论的分类器
平均风险定义为:
模式识别_2_基于贝叶斯决策理论的分类器
经证明:贝叶斯分类器,即谁概率大选谁能最小化错误率和平均风险
             

2.3 判别函数和决策面

数学观点中用等价函数代替概率。令模式识别_2_基于贝叶斯决策理论的分类器,其中模式识别_2_基于贝叶斯决策理论的分类器单调上升,模式识别_2_基于贝叶斯决策理论的分类器 称为判别函数,决策检测表示为
      
       若模式识别_2_基于贝叶斯决策理论的分类器,将x分类到模式识别_2_基于贝叶斯决策理论的分类器

划分相邻区域的决策面描述为模式识别_2_基于贝叶斯决策理论的分类器