第4章 NLP基础——4.7,4.8 隐马尔可夫模型
1.马尔可夫过程(Markov process)
(1)是一类随机过程
(2)在已知目前状态的条件下,它未来的演变不依赖于它以往的演变。主要研究一个系统的状况及其转移的理论。它是通过对不同状态的初始概率以及状态之间的转移概率的研究,来确定状态的变化趋势,从而达到对预测未来的目的。
无后效性,便利性
(3)马尔科夫链Markov chain是指具有马尔科夫性质的离散事件随机过程,即时间和状态参数都是离散的马尔科夫过程,是最简单的马尔科夫过程。
2.隐马尔可夫模型(Hidden Markov Model, HMM)
(1)作为一种统计分析模型,创立于20世纪70年代
(2)是结构最简单的动态贝叶斯网,是一种著名的有向图模型,主要用于时序数据建模(语音识别、自然语言处理等)。
(3)HMM是隐马尔可夫链的一种,它的状态不能直接观察到,但能通过观测向量序列观察到,每个观测向量都是通过某些概率密度分布表现为各种状态,每一个观测向量是由一个具有相应概率密度分布的状态序列产生。
3.应用场景
(1)中文分词
(2)机器翻译
(3)语音识别
(4)通信中的译码
马尔科夫随机场,无向图模型,不讲。
4.隐马尔可夫实现命名实体识别