视觉语言模型微调方法、装置、计算机设备及存储介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
视觉语言模型微调方法、装置、计算机设备及存储介质
申请号:CN202510602846
申请日期:2025-05-09
公开号:CN120508788A
公开日期:2025-08-19
类型:发明专利
摘要
本发明涉及人工智能、金融科技及数字医疗领域,公开了视觉语言模型微调方法、装置、计算机设备及存储介质,可对市场趋势预测、病历分析应用的优化。所述方法包括:获取目标领域的训练数据;初始化预训练视觉语言模型作为基础模型;通过所述基础模型生成所述训练数据的多个候选答案;验证多个候选答案并根据验证结果更新所述基础模型,以得到目标模型。本发明通过基础模型输出训练数据的多个候选答案,再基于验证结果对基础模型进行更新的方式,有助于利用多个候选答案挖掘数据中潜在的跨模态特征关联,能够更充分地利用有限数据,提升了少样本学习中模型的性能及泛化能力,切实满足了金融和医疗领域对高质量模型的应用需求。
技术关键词
微调方法 强化学习算法 答案 视觉 基础 计算机设备 生成训练数据 策略 可读存储介质 梯度算法 微调装置 处理器 模态特征 金融 模块 存储器 参数 病历