跨模态大升级!少量数据高效微调,LLM教会CLIP玩转复杂文本
跨模态大升级!少量数据高效微调,LLM教会CLIP玩转复杂文本在当今多模态领域,CLIP 模型凭借其卓越的视觉与文本对齐能力,推动了视觉基础模型的发展。CLIP 通过对大规模图文对的对比学习,将视觉与语言信号嵌入到同一特征空间中,受到了广泛应用。
来自主题: AI技术研报
6851 点击 2024-11-27 14:41
搜索
在当今多模态领域,CLIP 模型凭借其卓越的视觉与文本对齐能力,推动了视觉基础模型的发展。CLIP 通过对大规模图文对的对比学习,将视觉与语言信号嵌入到同一特征空间中,受到了广泛应用。