Transformer-QKV的计算
2024-03-29 16:28:08 4 举报
在之前的版本上做了调整,后续会继续更新Transformer其他细节的图
作者其他创作
大纲/内容
dq
d
V
Q
K
n
Attention Matrix
Z
×
Softmax
Outputs
假设没一个维度上的元素span class=\"equation-text\" contenteditable=\"false\" data-index=\"0\" data-equation=\
span style=\
Wk
dk = dq
Wq
Weights
Inputs
X
Wv
收藏
收藏
0 条评论
下一页
为你推荐
查看更多