马尔可夫随机场与条件随机场

本文仅仅讲解一下马尔可夫随机场和条件随机场的定义和形式,不会涉及到条件随机场的概率计算和模型学习问题,因为阅读的书籍和博客都讲的很混乱,所以深入的讲解很难进行,望见谅。

一、马尔可夫随机场

马尔可夫随机场就是概率无向图模型,它是一个可以用无向图表示联合概率分布。
假设有一个联合概率分布P(Y),其中Y代表一组随机变量,该联合概率分布可以由无向图来表示,图中的每一个节点表示的是Y中的一个随机变量,图中的每条边表示的两个随机变量之间的概率依赖关系,那么这个联合概率分布P(Y)怎么样才能构成一个马尔可夫随机场呢?
答案是:联合概率分布P(Y)满足成对马尔可夫性、局部马尔可夫性和全局马尔可夫性这三个中的任意一个。

成对马尔可夫性:
设P(Y)对应的概率无向图为G,u和v是图G中任意两个没有边连接的节点,它们代表随机变量组Y中的两个随机变量,我们记为Yu和Yv,将图G中除了u和v以外的节点记为O,所以O对应一个随机变量组记为YO。若在给定随机变量组YO条件下,随机变量Yu和Yv是独立的,即P(Yu, Yv | YO) = P(Yu | YO) P(Yv | YO),那就称联合概率分布P(Y)满足成对马尔可夫性。

局部马尔可夫性:
设P(Y)对应的概率无向图为G,v是图G中的任意一个节点,它对应的随机变量用Yv表示,W是图G中所有跟v节点有边连接的节点集合,它对应的随机变量组用YW表示,O是图G中除了v和W以外的所有节点的集合,它对应的随机变量组用YO表示。若在给定随机变量组YW条件下,随机变量Yv和随机变量组YO是独立的,即P(Yv, YO | YW) = P(Yv | YW)P(YO | YW),那就称联合概率分布P(Y)满足局部马尔可夫性。

全局马尔可夫性:
设P(Y)对应的概率无向图为G,A、B和C是图G中的任意三个节点集合,其中A和B被C隔开,如下图所示,它们分别对应三个随机变量组YA、YB和YC。若给定随机变量组YC,随机变量组YA和随机变量组YB是独立的,即P(YA, YB | YC) = P(YA | YC)P(YB|YC),那就称联合概率分布P(Y)满足全局马尔可夫性。
马尔可夫随机场与条件随机场
现在来给定一个马尔可夫随机场的完整定义
设有联合概率分布P(Y),它可以用无向图表示,若P(Y)满足成对马尔可夫性、局部马尔可夫性和全局马尔可夫性这三个中的任意一个,就称此联合概率分布为马尔可夫随机场或者概率无向图模型。

二、条件随机场

条件随机场的定义:
设X与Y是随机变量组,P(Y|X)是给定X的条件下Y的条件概率分布。若P(Y)构成一个由无向图表示的马尔可夫随机场,且P(Yv | X, YW) = P(Yv | X, YO)对任意的节点v都满足,则称条件概率分布P(Y|X)为条件随机场。其中,v为图中的任意一个节点,它代表的随机变量为Yv,W为图中所有与节点v有边连接的节点集合,它代表的随机变量组为YW,O为图中除了v节点之外的所有节点集合,它代表的随机变量组为YO

线性链条件随机场的定义:
设X = (X1, X2, … ,Xn)与Y = (Y1, Y2, … ,Yn)是都是随机变量组,其中随机变量组Y可以用线性链表示,如下图所示。若P(Y)构成一个由无向图表示的马尔可夫随机场,且图中的任意一个节点 Yi 都满足 P( Yi | X, Yi-1, Yi+1) = P( Yi | X, Y1, Y2, … ,Yi-1, Yi+1 ,…, Yn) ,其中当 i 等于 1 和 n 时,只考虑单边,则称条件概率P( Y | X)为线性链条件随机场。 若满足了上述要求,那么图1和图2都是条件随机场,其中图2是 X和Y具有相同结构的条件随机场。

图1:
马尔可夫随机场与条件随机场
图2:
马尔可夫随机场与条件随机场