序列模型用途介绍及数学符号
1. 序列模型用途
之所以要用到序列模型,是因为,在现实生活中,我们的很多数据都具有连续的关系,比如
-
语音识别:根据音频数据,识别为语言文本
-
音乐生成:给定0个或某几个音节,自动生成歌曲
-
情感分析:根据一段文本,来判断其情绪
-
DNA序列分析:从给定的DNA序列中,标记出值得关注的某一段序列
-
机器翻译:德语文本转英文
-
视频行为识别:根据视频中一段连续的画面,判断画面中人的行为
-
命名实体识别:识别出文本中的所有人名
2. 序列模型常用的数学符号
如下举一个例子:
输入X:Harry Potter and Hermoine Granger invented a new spell.
输出Y:1 1 0 1 1 0 0 0 0
目标是识别给定句子中的人名,也就是所谓的实体词。
下图中用红色文字标注各个数学符号的含义:
总结一下,圆括号表示第i个样本,尖括号表示某个样本中第t个值。
3. 用词典和one-hot编码表示文本
文字、单词无法直接进行计算,所以要转换为数字。下图就是转换步骤:
-
首先,要做一个字典,这里假设字典中含有10000个单词。
-
然后,将输入文本中的每一个词,都找到其在字典中的位置,并映射为one-hot编码。
-
比如Harry在字典中的位置(索引)是4075,则需要用一个10000维度的向量来表示Harry,这个向量在4075位置上的值为1,其他位置上的值为0。注意句子中的每一个单词都要用相同维度的向量来表示。
参考
- Andrew Ng. deep learning class. sequence model.