摘要
本发明涉及人工智能、金融科技及数字医疗领域,公开了视觉语言模型微调方法、装置、计算机设备及存储介质,可对市场趋势预测、病历分析应用的优化。所述方法包括:获取目标领域的训练数据;初始化预训练视觉语言模型作为基础模型;通过所述基础模型生成所述训练数据的多个候选答案;验证多个候选答案并根据验证结果更新所述基础模型,以得到目标模型。本发明通过基础模型输出训练数据的多个候选答案,再基于验证结果对基础模型进行更新的方式,有助于利用多个候选答案挖掘数据中潜在的跨模态特征关联,能够更充分地利用有限数据,提升了少样本学习中模型的性能及泛化能力,切实满足了金融和医疗领域对高质量模型的应用需求。