Transformer模型
2024-05-24 16:21:33 17 举报
Transformer模型框架
作者其他创作
大纲/内容
输入
残差链接和层归一化
多头注意力机制
编码器堆叠 N 次
输出概率
Softmax层
掩码多头注意力机制
输入嵌入
前馈神经网络
线性层
位置编码
输出
解码器堆叠 N 次
收藏
0 条评论
下一页