序列模型用途介绍及数学符号

1. 序列模型用途

之所以要用到序列模型,是因为,在现实生活中,我们的很多数据都具有连续的关系,比如

序列模型用途介绍及数学符号

  1. 语音识别:根据音频数据,识别为语言文本

  2. 音乐生成:给定0个或某几个音节,自动生成歌曲

  3. 情感分析:根据一段文本,来判断其情绪

  4. DNA序列分析:从给定的DNA序列中,标记出值得关注的某一段序列

  5. 机器翻译:德语文本转英文

  6. 视频行为识别:根据视频中一段连续的画面,判断画面中人的行为

  7. 命名实体识别:识别出文本中的所有人名

2. 序列模型常用的数学符号

如下举一个例子:
输入X:Harry Potter and Hermoine Granger invented a new spell.
输出Y:1 1 0 1 1 0 0 0 0
目标是识别给定句子中的人名,也就是所谓的实体词。

下图中用红色文字标注各个数学符号的含义:

序列模型用途介绍及数学符号

总结一下,圆括号表示第i个样本,尖括号表示某个样本中第t个值。

3. 用词典和one-hot编码表示文本

文字、单词无法直接进行计算,所以要转换为数字。下图就是转换步骤:

序列模型用途介绍及数学符号

  1. 首先,要做一个字典,这里假设字典中含有10000个单词。

  2. 然后,将输入文本中的每一个词,都找到其在字典中的位置,并映射为one-hot编码。

  3. 比如Harry在字典中的位置(索引)是4075,则需要用一个10000维度的向量来表示Harry,这个向量在4075位置上的值为1,其他位置上的值为0。注意句子中的每一个单词都要用相同维度的向量来表示。

参考

  • Andrew Ng. deep learning class. sequence model.