模式识别_2_基于贝叶斯决策理论的分类器
2.1 引言
以特征值的统计概率为基础
给定M个类(
)的分类任务和一个用特征向量x表示的样本,生成一系列条件概率(后验概率)
2.2 贝叶斯决策理论
先验概率:
样本总数,
第i类样本数(每个类中样本的占比)
类条件(概率密度函数or概率):
描述一类中特征向量的分布情况,相对于x的
的似然函数
则我们很容易表示
如果,先验概率相等,即
=1/2,则最大估计值只取决于x的条件概率密度函数的估计值,如下图:
对概率加权(反映不同类型错误对总错误率的贡献程度)后,定义平均风险:
谁上述表达式一般化,对一个M类问题,属于
的特征向量x位于
产生错误。没一个这样的情况出现惩罚系数
(也称损失),组成的矩阵称为L损失矩阵(对角线上
对应正确的决策,设为0)。则与第k类
风险定义为:
平均风险定义为:
经证明:贝叶斯分类器,即谁概率大选谁能最小化错误率和平均风险
2.3 判别函数和决策面
数学观点中用等价函数代替概率。令
,其中
单调上升,
称为判别函数,决策检测表示为
若
,将x分类到
划分相邻区域的决策面描述为