CLIP多模态预训练模型

2025-03-26 00:22:27 0 举报
CLIP(Contrastive Language-Image Pre-training):是一种多模态预训练神经网络。通过对比学习将图像和文本映射到共享特征空间,支持零样本分类和跨模态检索,广泛应用于图文匹配、生成式AI等领域。
CLIP
多模态
预训练模型
神经网络
算法架构
作者其他创作
大纲/内容
评论
0 条评论
下一页