HMM详解(NLP)

1 隐马尔可夫模型HMM

1.1 什么样的问题需要HMM模型

使用HMM模型时我们的问题一般有这两个特征:

  1. 我们的问题是基于序列的,比如时间序列,或者状态序列。
  2. 我们的问题中有两类数据,一类序列数据是可以观测到的,观测序列;而另一类数据是不能观察到的,隐藏状态序列,简称状态序列

有了这两个特征,那么这个问题一般可以用HMM模型来尝试解决。这样的问题在实际生活中是很多的。比如:
我在和你说话,我发出的一串连续的声音就是观测序列(这些声音的取值从观测状态集合中取),而我实际要表达的一段话的意思就是隐藏状态序列(取值从隐藏状态集合中取)。

1.2 HMM模型的定义

HMM详解(NLP)
HMM模型做了两个很重要的假设如下:

  1. HMM详解(NLP)
  2. HMM详解(NLP)
  3. HMM详解(NLP)

HMM详解(NLP)

1.3 一个HMM模型实例

HMM详解(NLP)
HMM详解(NLP)
HMM详解(NLP)

1.4 HMM观测序列的生成

HMM详解(NLP)

1.5 HMM模型的三个基本问题

HMM详解(NLP)
词性标注任务对应于其中的解码问题,我们可以这样理解:
对于给定的词性标注任务,如下所示:

输入序列 O:I love NLP
输出序列 I:PRP VB NN

HMM详解(NLP)
观测序列 对应了 输入序列 O
隐藏状态序列 对应了 输出序列 I

2 维特比算法 解决 解码问题

见链接即可。