LSTM
2022-04-10 15:41:58 148 举报
LSTM(Long Short-Term Memory)是一种特殊的循环神经网络,它能够学习长期依赖性信息。LSTM由Hochreiter & Schmidhuber (1997)提出,主要解决了长序列训练过程中的梯度消失和梯度爆炸问题。在长短时记忆网络中,信息能够在突触上延迟的时间被存储下来。其中,“短期记忆”是指神经元的输出状态只能维持一小段时间,而“长期记忆”则是指神经元的输出状态可以维持相当长的时间。LSTM通过引入门控机制来控制信息的流动,从而有效地捕捉到输入序列中的长期依赖关系。