LSTM
2019-05-25 10:42:18 59 举报
LSTM(Long Short-Term Memory)是一种特殊的循环神经网络,它可以学习长期依赖性信息。LSTM由Hochreiter & Schmidhuber (1997)提出,主要解决长序列训练过程中的梯度消失和梯度爆炸问题。在长短时记忆网络中,我们通常称隐藏层的维度为“记忆单元”的数量。这些“记忆单元”能够将信息从较早的时间步传递到较晚的时间步,从而使LSTM能够捕捉到时间序列中的长期依赖关系。LSTM广泛应用于各种自然语言处理任务,如机器翻译、语音识别等。总之,LSTM是一种强大的神经网络结构,能够有效地处理具有长期依赖关系的序列数据。
作者其他创作
大纲/内容
z3
Wi
Wf
h3
L
l2
h1
Wo
c3
c1
l1
c2
h2
Wy
zT
cT
z1
l3
Wc
hT
z2
lT
0 条评论
下一页