4 朴素贝叶斯法

  • 朴素贝叶斯法是基于贝叶斯定理与特征条件独立假设的分类
    方法
  • 对给定的训练数据集,先基于特征条件独立假设学习输入输出的联合
    概率分布;
    • 然后基于此模型,
    • 对给定输入xx,用贝叶斯定理求出后验概率最大的输出yy.
    • 朴素贝叶斯法实现简单,学习与预测的效率都很高,是一种常用的方法

  • 本章朴素贝叶斯法,
    • 包括朴素贝叶斯法的学习与分类、朴素贝叶斯法的参数估计算法

4.1 朴素贝叶斯法的学习与分类

4.1.1 基本方法

  • 输入空间XRn\mathcal{X}\subseteq R^n
  • 输出空间为类标记集合Y={c1,...,cK}\mathcal{Y}=\{c_1,...,c_K\}
  • 特征向量xXx\in\mathcal{X},输出为类标记( class label)yYy\in\mathcal{Y}
  • XX是输入空间况上的随机向量,YY是输出空间上的随机变量
  • P(X,Y)P(X,Y)XXYY的联合概率分布,
    • 训练数据集

T={(x1,y1),...,(xN,yN)}T=\{(x_1,y_1),...,(x_N,y_N)\}

  • P(X,Y)P(X,Y)独同产生

  • 朴素贝叶斯法通过训练数据集学习联合概率分布P(X,Y)P(X,Y)
  • 学习先验概率分布

4 朴素贝叶斯法

  • 条件概率分布

4 朴素贝叶斯法

  • 于是学到联合概率分布P(X,Y)P(X,Y)

  • 条件概率P(X=xY=ck)P(X=x|Y=c_k)有指数级数量的参数,
    • 其估计实际是不可行的
  • x(j)x^{(j)}可取值有SjS_j个,j=1,2,...,nj=1,2,...,n,
    • YY可取KK个,
    • 那么参数个数Kj=1nSjK\prod_{j=1}^n S_j

  • 朴素贝叶斯法对条件概率分布作了条件独立性的假设.
  • 这是个较强假设,朴素贝叶斯法由此得名

4 朴素贝叶斯法

  • 朴素贝叶斯法实际上学习到生成数据的机制,属生成模型.
  • 条件独立假设:
    • 用于分类的特征在类确定的条件下都是条件独立的.
    • 这一假设使朴素贝叶斯法变得简单,但牺牲分类准确率

  • 朴素贝叶斯法分类时,对输入xx,
    • 通过学习到的模型计算后验概率分布P(Y=ckX=x)P(Y=c_k|X=x)
    • 将后验概率最大的类作为xx的类输出
    • 后验概率根据贝叶斯定理

4 朴素贝叶斯法

  • 于是,朴素贝叶斯分类器可表示为

4 朴素贝叶斯法

4.1.2后验概率最大化的含义

  • 朴素贝叶斯法将实例分到后验概率最大的类中.
    • 这等价于期望风险最小化.
  • 设0-1损失函数

4 朴素贝叶斯法

  • 这时,期望风险函数为

4 朴素贝叶斯法

  • 期望是对联合分布P(X,Y)P(X,Y)取的,
    • 由此取条件期望

4 朴素贝叶斯法

  • 为使期望风险最小化,只需对X=xX=x逐个极小化,
  • 由此得到:

4 朴素贝叶斯法

  • 根据期望风险最小化准则就得到了后验概率最大化准则

4 朴素贝叶斯法

  • 即朴素贝叶斯法所采用的原理

here