算法 | Transformer模型
2024-05-10 12:40:42 7 举报
Transformer是一个利用注意力机制来提高模型训练速度的模型。
作者其他创作
大纲/内容
inputs
Add &Norm
N×
PositionalEncoding
Softmax
MaskedMulti-HeadAttention
InputEmbedding
Multi-HeadAttention
Feed Forward
Outputs(shifed right)
OutputEmbedding
Linear
OutputProbabilities
0 条评论
下一页