您的位置: 首页 > 文章 > RNN之LSTM RNN之LSTM 分类: 文章 • 2024-11-25 18:33:57 参考 长短期记忆(Long short-term memory, LSTM)是一种特殊的RNN,主要是为了解决长序列训练过程中的梯度消失和梯度爆炸问题。 LSTM的基本输入输出 如图所示,不同于普通的RNN,LSTM有两个传递状态,分别为ct和htc^t和h^tct和ht,其中c变化缓慢,而h变化可以很大。 zi,zf,zo,z四个状态z^i,z^f,z^o,z四个状态zi,zf,zo,z四个状态 计算方法如上图,这里xt和ht−1相互拼接成一个维度更高的向量再同各种W计算x^t和h^{t-1}相互拼接成一个维度更高的向量再同各种W计算xt和ht−1相互拼接成一个维度更高的向量再同各种W计算 计算 进行如图所示计算