登录免费注册

首页  流程图  详情

transformer训练与预测时的数据流

2024-03-17 19:47:04   0  举报





transformer训练与预测时的数据流

为你推荐

查看更多



音频数据流输出

数据流图模板

数据流处理

consumer数据流

介绍数据集从输入到模型的每一层，被转换为什么形状，并且是如何分解输入到每一层网络的。

作者其他创作

大纲/内容

红色的线：只在预测的时候使用

Add ＆Norm

预测的时候使用

q

k=Y

训练数据集

X

训练时需要，预测时为None

concat

Input Embedding

Linear

N×

v

q=X

Y_valid_length形状(batch_size)

v=Y

预测时，第一个输入token: <bos>

Feed Forward

v=X

Positional Encoding

Y

decode_output

kv的有效长度

Multi-Head Attention

Softmax

q=Y

训练时，用于计算loss

X_valid_length形状(batch_size)

encode_output

k

预测的数据

MaskedMulti-Head Attention

embedding_output

k=X

OutputProbabilities

Output Embedding

transformer训练与预测时的数据流

 收藏

立即使用

transformer训练与预测时的数据流

职业：本科













评论

0 条评论

回复删除



取消

回复

下一页

为了保护您和被举报人的权利，请您慎重填写举报原因，我们会认真核实调查。

确定



图形选择

思维导图

主题

补充说明

AI生成





修改AI描述

去编辑

重新生成

提示 

关闭后当前内容将不会保存，是否继续？

取消

确定