RNN之LSTM

参考
长短期记忆(Long short-term memory, LSTM)是一种特殊的RNN,主要是为了解决长序列训练过程中的梯度消失和梯度爆炸问题。

LSTM的基本输入输出

RNN之LSTM
如图所示,不同于普通的RNN,LSTM有两个传递状态,分别为cthtc^t和h^t,其中c变化缓慢,而h变化可以很大。

zi,zf,zo,zz^i,z^f,z^o,z四个状态

RNN之LSTM
RNN之LSTM
计算方法如上图,这里xtht1Wx^t和h^{t-1}相互拼接成一个维度更高的向量再同各种W计算

计算

进行如图所示计算
RNN之LSTM