前言

看了这一篇，做一个笔记，万一以后又做任务二了

前人的工作(不重要)

DR-BiLSTM: Dependent Reading Bidirectional LSTM for Natural Language Inference

模型(*)

DR-BiLSTM: Dependent Reading Bidirectional LSTM for Natural Language Inference

按照自己的理解，将其encoding层和inference层。首先明确模型输入: u = [ u 1 u_1 u1, u 2 u_2 u2…], v = […]里面的元素都是300维的glove词向量。

encoding层

先说 “encode u depending on v”：

首先在v上做bilstm，得到两个返回值，分别是每一个时间步的隐藏层输出和（最后时间步的隐藏层，记忆细胞）
然后把（最后时间步的隐藏层，记忆细胞）作为下一个bilstm的隐藏层、记忆细胞的初始化权重，这个bilstm在u上面做，也得到两个返回值，但我们只需要前面那个(u^)，可以把它理解为: 融合了 v的信息，并且也捕捉了u的上下文信息之后的，在u上的每一个时间步的隐藏层输出

所以 "encode v depending on u"也是一样~

DR-BiLSTM: Dependent Reading Bidirectional LSTM for Natural Language Inference

attention

计算一个权重表

假设u序列本来是n长度，v是m长度的。 u序列经过上面的bilstm变成了 nx2d(记为X)；v序列经过上面的bilstm变成了mx2d(记为Y)。然后只要计算 X x Y T Y^T YT就得到了一个 n x m 的权重矩阵。
DR-BiLSTM: Dependent Reading Bidirectional LSTM for Natural Language Inference

利用这个权重表，用u表示v；用v表示u

下面做的就是，我再计算一个东西，就比如 DR-BiLSTM: Dependent Reading Bidirectional LSTM for Natural Language Inference
这个东西虽然叫u，但其实是在 v上面做加权求和得到的一个向量。这里面的"权"就是上面计算出来的。
用一句白话说:下面的 u i u_{i} ui(~不会打…) 是由v中m 个向量加权求和得到的。
DR-BiLSTM: Dependent Reading Bidirectional LSTM for Natural Language Inference