知识蒸馏
2023-02-04 22:39:35 4 举报
教师学生网络训练过程
作者其他创作
大纲/内容
softmax(T=1)
input
loss Fn
distillation loss
softmax(T=t)
Student
hard predictions
student loss
soft labels
soft predictions
total loss
Teacher
hard label y(ground truth)
0 条评论
下一页