一种基于提示蒸馏的不完备多模态学习方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于提示蒸馏的不完备多模态学习方法
申请号:CN202511217499
申请日期:2025-08-28
公开号:CN120930722A
公开日期:2025-11-11
类型:发明专利
摘要
本发明提出了一种基于提示蒸馏的不完备多模态学习方法,旨在提升多模态模型在模态缺失场景下的鲁棒性与泛化能力。该方法融合知识蒸馏与提示学习的优势,构建了由分层提示生成器、教师网络和推理网络组成的协同框架,实现模态间共享知识与样本级细粒度信息的高效迁移。本方法首先构建并预处理多模态数据集;然后基于提示蒸馏机制,在教师网络和推理网络之间建立高效的知识传递机制;最后利用训练完成的提示生成器与推理网络对不完备模态样本进行推理,显著提升下游任务的准确性与适应能力。本发明通过提示生成器与双蒸馏机制的协同优化,在保持模型轻量化的同时显著提升了知识迁移效率,为复杂真实环境中的多模态学习提供了高效解决方案。
技术关键词
多模态学习方法 推理网络 教师 蒸馏 样本 数据 交叉注意力机制 编码器 分层 多层感知机 文本 图像像素 多层结构 超参数 索引 鲁棒性