attention机制
2021-03-10 14:14:46 101 举报
注意力机制(Attention Mechanism)是一种用于提高模型在处理序列数据时的性能的技术。它通过计算输入序列中每个元素对输出序列的贡献程度,从而让模型能够关注到更重要的信息。这种机制在自然语言处理、计算机视觉和语音识别等领域取得了显著的成果。 简单来说,注意力机制可以帮助模型在处理长序列时,更好地关注到与当前任务相关的部分,从而提高预测的准确性。例如,在机器翻译任务中,注意力机制可以让模型在生成目标语言的单词时,更加关注源语言句子中的对应部分。
作者其他创作
大纲/内容
v1
v3
v2
an
...
a2
Query
*
原始分值归一化处理
Kn
+
计算Q、K、V的相关性
S1
S2
softmax函数归一化
K1
Sn
..
对Value进行加权求和
K2
a1
attention value
收藏
0 条评论
下一页