深度学习之Transformer架构图

2024-08-17 16:26:33 2 举报
Transformer 架构主要由输入部分、多层编码器、多层解码器以及输出部分组成。其中,输入部分包括源文本嵌入层、位置编码器;编码器部分由 N 个编码器层堆叠而成;解码器部分由 N 个解码器层堆叠而成;输出部分包括线性层和Softmax 层。
架构图
Transformer
深度学习
算法
模型
作者其他创作
大纲/内容
评论
0 条评论
下一页