最大熵模型——数学模型

【最大熵模型】

【最大熵原理】

不再赘述最大熵原理,简言之,最大熵原理认为所选择的模型必须满足约束条件,不确定的部分都认为是等可能的。利用熵的最大化实现等可能的表示。

熵公式:       最大熵模型——数学模型     

其中    最大熵模型——数学模型,   最大熵模型——数学模型表示X的取值个数,当且仅当X的分布式均匀分布时等号成立。即,X服从均匀分布时,熵最大。

【最大熵模型的定义】

最大熵模型,顾名思义就是将最大熵原理应用到分类训练出的模型。

【分类模型】 条件概率分布  最大熵模型——数学模型

【输入】  最大熵模型——数学模型

【输出】  最大熵模型——数学模型

【模型表示】对于给定的输入X以条件概率最大熵模型——数学模型输出Y。

【学习目标】对于给定训练数据集最大熵模型——数学模型   运用最大熵原理选择最好的分类模型。


补充知识:【经验分布函数】

最大熵模型——数学模型

【模型满足条件】

(1)对于给定数据集T,确定联合分布最大熵模型——数学模型和边缘分布最大熵模型——数学模型的经验分布,分别记为最大熵模型——数学模型,  最大熵模型——数学模型


最大熵模型——数学模型

最大熵模型——数学模型

其中,最大熵模型——数学模型表示数据集中样本(x,y)出现的频数,N 表示训练样本容量。


【特征函数】

最大熵模型——数学模型

最大熵模型——数学模型为二值函数,x与y满足事实时为1,否则为0.


最大熵模型——数学模型】 

特征函数最大熵模型——数学模型关于经验分布最大熵模型——数学模型的期望值。

最大熵模型——数学模型

最大熵模型——数学模型】 

特征函数最大熵模型——数学模型关于模型最大熵模型——数学模型与经验分布最大熵模型——数学模型的期望值。

最大熵模型——数学模型

如果模型能够获取训练数据集中的信息,就可以假设这两个期望值相等。即:

最大熵模型——数学模型                                           (1.1)

     最大熵模型——数学模型       (1.2)

将(1.1)或者(1.2)作为学习的约束条件。

【补充 】

联合概率,边缘概率,条件概率之间的关系

最大熵模型——数学模型


【最大熵模型】

【约束条件】   

 最大熵模型——数学模型

【条件熵】 

在条件概率分布最大熵模型——数学模型上的条件熵

    最大熵模型——数学模型

公式中的对数为自然对数。

模型集合C中条件熵最大的模型称为最大熵模型。

【最大熵模型的学习】

对于给定的数据集最大熵模型——数学模型,特征函数最大熵模型——数学模型,i=1,2,...n。

最大熵模型的学习过程可以等价于约束条件的最优化。

最大熵模型——数学模型

最大熵模型——数学模型

最优化习惯:将最大化问题转换为最小化问题。

最大熵模型——数学模型

求解最优化问题即求出上述三个式子的解。

求解步骤:

(1)引进拉格朗日函数最大熵模型——数学模型

最大熵模型——数学模型


原始问题:                 最大熵模型——数学模型

对偶问题:                 最大熵模型——数学模型

因为拉格朗日函数是P 上的凸函数,所以求解对偶问题与求解原始问题是等价的。


(2)求解内部极小化问题     最大熵模型——数学模型

最大熵模型——数学模型 是w的函数

记为

 最大熵模型——数学模型

其解记为

 最大熵模型——数学模型

接下来求解L对 P(y|x)的偏导数,如下:

最大熵模型——数学模型

令偏导等于0,在 最大熵模型——数学模型的情况下,解得:

最大熵模型——数学模型

因为     

 最大熵模型——数学模型


所以     

  最大熵模型——数学模型

即       

  最大熵模型——数学模型


得到 :    

  最大熵模型——数学模型,                (1.3)

其中,

    最大熵模型——数学模型                        (1.4)


由公式(1.3)(1.4)表示的模型最大熵模型——数学模型就是最大熵模型,其中最大熵模型——数学模型为规范化因子,最大熵模型——数学模型为特征函数,最大熵模型——数学模型为特征的权值。

(3)求解对偶问题外部的极大化问题 最大熵模型——数学模型

其解记为:

最大熵模型——数学模型

其中                                                            最大熵模型——数学模型

也就是说最大熵模型的学习归结到对对偶函数最大熵模型——数学模型的极大化问题。

求解出最大熵模型——数学模型的解最大熵模型——数学模型,用来表示最大熵模型——数学模型,也就得到最大熵模型最大熵模型——数学模型

【例题】

最优化问题为:

最大熵模型——数学模型


(1) 拉格朗日函数

最大熵模型——数学模型

对偶问题:最大熵模型——数学模型

(2)求内部极小化问题

最大熵模型——数学模型对P的偏导数:

最大熵模型——数学模型


令各偏导数等于0得到:

最大熵模型——数学模型

最大熵模型——数学模型

得到:

最大熵模型——数学模型

即:

(3)求最大熵模型——数学模型的外部极大化问题最大熵模型——数学模型

求解:

最大熵模型——数学模型

分别对最大熵模型——数学模型求偏导数

最大熵模型——数学模型

最大熵模型——数学模型

令上述偏导数为0,得到:

最大熵模型——数学模型

最大熵模型——数学模型

即可利用最大熵模型求得所求概率:

最大熵模型——数学模型