视觉语言模型微调方法、装置、计算机设备及存储介质

申请号：CN202510602846

申请日期：2025-05-09

公开号：CN120508788A

公开日期：2025-08-19

类型：发明专利

摘要

本发明涉及人工智能、金融科技及数字医疗领域，公开了视觉语言模型微调方法、装置、计算机设备及存储介质，可对市场趋势预测、病历分析应用的优化。所述方法包括：获取目标领域的训练数据；初始化预训练视觉语言模型作为基础模型；通过所述基础模型生成所述训练数据的多个候选答案；验证多个候选答案并根据验证结果更新所述基础模型，以得到目标模型。本发明通过基础模型输出训练数据的多个候选答案，再基于验证结果对基础模型进行更新的方式，有助于利用多个候选答案挖掘数据中潜在的跨模态特征关联，能够更充分地利用有限数据，提升了少样本学习中模型的性能及泛化能力，切实满足了金融和医疗领域对高质量模型的应用需求。

技术关键词

微调方法强化学习算法答案视觉基础计算机设备生成训练数据策略可读存储介质梯度算法微调装置处理器模态特征金融模块存储器参数病历