登录免费注册

首页  流程图  详情

transformer 模型算法

2023-07-18 08:54:51   1  举报





用流程图的形式详细展示了 transformer 模型的算法细节

transformer

NLP

人工智能

大模型

算法

作者其他创作

大纲/内容

dot product

128 * 31 * 512

linear

128 * 8 * 27 * 31

split 8

q

dropout

Add

pos embedding

out

softmax

norm

128 * 31 * 512

v

Linear

128 * 8 * 31 * 31

DecoderLayer

128 * 1 * 27 * 27

128 * 27 * 8 * 64

128 * 8 * 64 * 31

128 * 8 * 64 * 31

concat

128 * 8 * 27 * 64

128 * 27 * 512

token embedding

src_mask

ScaleDotProductAttention

128 * 1 * 1 * 31

串行6次

128 * 8 * 31 * 64

EncoderLayer

scale

128 * 8 * 27 * 27

512 * 512

masked_fill

k

128 * 27 * 7853

128 * 8 * 31 * 64

128 * 8 * 31 * 64

128 * 31 * 512

Decoder

MultiHeadAttention

128 * 31

31 * 512

src

Encoder

tgt

128 * 1 * 1 *31

look up

ffn

enc_src

128 * 31 * 8 * 64

128 * 8 * 64 * 27

27 * 512

128 * 27 * 512

max_work_size * 512

transformer 模型算法流程

128 * 27

512 * 7853

tgt_mask

vocab_count * 512

transformer 模型算法

 收藏

立即使用

transformer 模型算法

职业：暂无













评论

0 条评论

下一页

为你推荐

查看更多



Transformer模型细节详解

Transformer模型细节详解

算法 | Transformer模型

算法 | Transformer模型

Transformer模型

2025主流深度学习模型架构（Transformer、混合专家模型、多模态、GAN、GCN、Diffusion）

2025主流深度学习模型架构（Transformer、混合专家模型、多模态、GAN、GCN、Diffusion）