贝叶斯网络
贝叶斯网络(Bayesian network),又称信念网络(belief network)或是有向无环图模型(directed acyclic graphical model),是一种概率图型模型。贝叶斯网络的关键在于网络结构和条件概率表。
下列为一个简单的贝叶斯网络:

有了网络结构和概率表就可以得到任意变量的联合概率分布。
例题:

通过贝叶斯网络确定条件独立

朴素贝叶斯分类器
朴素贝叶斯分类器采用了“条件独立性假设”。应用贝叶斯公式的有监督学习算法。求P(y∣x1,x2,...,xn)。
利用贝叶斯公式由
P(y∣x1,x2,...xn)=P(x1,x2,...xn)P(y)P(x1,x2,...xn∣y)
其中x1,x2,...xn为给定样本的n个特征,我们要根据已给特征来判定该样本属于哪个类别的概率大。
根据"条件独立性假设",对上式有
P(y∣x1,x2,...xn)=P(y)P(x1,x2,...xn)Πi=1nP(xi∣y)
对于一个样本来说,无论他属于哪个类别,P(x1,x2,...xn)是相同的,因此我们可以得到
朴素贝叶斯分类器:
P(y∣x1,x2,...xn)=yargmaxP(y)Πi=1nP(xi∣y)
显然朴素贝叶斯分类器的训练方式,就是根据训练集样本,先验地给出P(y),并为每个属性估计条件概率P(xi∣y)。
- 令Dc表示训练集D中类标签为c的样本的集合,则P(c)
P(c)=∣D∣∣Dc∣
- 若特征为连续的,我们假设P(xi∣y)→N(μc,i,δc,i2),其中μc,i,δc,i2表示第c类样本关于特征xi的均值和方差
- 若特征为离散的,令∣Dc,xi∣表示属于第c类的样本中,xi属性的个数。
P(xi∣c)=∣Dc∣∣Dc,xi∣
- 注意:为避免其他属性携带的信息被训练集中未出现的属性值抹去,我们采用拉普拉斯平滑,令N表示类别数,Ni表示xi属性可能的取值数,则有
P(c)=∣D∣+N∣Dc∣+1
P(xi∣c)=∣Dc∣+Ni∣Dc,xi∣+1
举例说明:垃圾邮件分类
