自然语言处理-2-隐马尔科夫模型(公式推导)

1、自然语言处理常用模型种类

**生成式模型:**根据山羊的特征,来算出这只羊是山羊的概率有多大;再根据绵羊的特征,算出这只羊是绵羊的概率为多大。再判断在哪个里面的概率更大,就属于哪一种。如Naive Bayes、Hidden Markov Model、LDA
**判别式模型:**直接得到判别边界。比如说要判断一只羊是山羊还是绵阳,直接根据这只羊的特征,分别求出其是山羊和是绵阳的概率,哪个大就属于哪一种。如Linear Regression、SVM、KNN
非线性模型: SVM的非线性核函数、Neural Network

2、马尔科夫模型

2.1特点

马尔科夫模型属于典型的生成式模型,适用于处理时间序列数据。
马尔科夫链的主要性质是“无记忆性”,即下一状态的概率分布只能由当前状态决定。

2.2状态初始化概率和状态转移概率

马尔可夫模型的训练参数就是状态初始化概率分布和状态转移概率分布。
对于一阶马尔科夫链,给出如下例子,给定第一天的天气情况,用来判断接下来几天的天气情况:
自然语言处理-2-隐马尔科夫模型(公式推导)
一阶马尔科夫性只能表示当前变量于前一个变量的关系,为了表达当前变量与更早变量的关系,需要引入高阶马尔科夫性。

2.3参数估计-极大似然

此外,在这个模型里,状态初始化概率和状态转移概率是需要学习的参数,在现实情况中,每天的天气变化会产生各种不同的观测数据,利用这些历史数据来自动估计模型参数,需要用到的方法是极大似然估计
自然语言处理-2-隐马尔科夫模型(公式推导)
自然语言处理-2-隐马尔科夫模型(公式推导)
以三个关于天气情况的观测序列作为依据来得到模型的状态初始化概率分布和状态转换概率分布。
自然语言处理-2-隐马尔科夫模型(公式推导)

3、隐马尔科夫模型

3.1观测状态与隐状态

天气的阴晴可以通过地面的潮湿程度或者是空气的湿润程度等其他因素来预测,这些借以预测的因素被我们称之为是观测状态,而实际的天气情况则是隐状态。
下图左边是一条隐马尔科夫链的传导过程,右图是一个观测状态生成概率分布自然语言处理-2-隐马尔科夫模型(公式推导)
这种情况下引入隐马尔科夫模型

3.2隐状态初始化概率、隐状态转移概率和观测状态生成概率

自然语言处理-2-隐马尔科夫模型(公式推导)
自然语言处理-2-隐马尔科夫模型(公式推导)
自然语言处理-2-隐马尔科夫模型(公式推导)

自然语言处理-2-隐马尔科夫模型(公式推导)
自然语言处理-2-隐马尔科夫模型(公式推导)

自然语言处理-2-隐马尔科夫模型(公式推导)
自然语言处理-2-隐马尔科夫模型(公式推导)

3.3三个基本问题

给定模型参数,如何计算一个观测状态序列的概率?

自然语言处理-2-隐马尔科夫模型(公式推导)
自然语言处理-2-隐马尔科夫模型(公式推导)
动态规划算法
2、给定模型参数和观测状态序列,如何而计算一个最可能的隐状态序列?
3、给定观测序列集合,如何从中估计模型参数?