基于多模态大模型灵活关联控制的图像问答方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于多模态大模型灵活关联控制的图像问答方法
申请号:CN202510201200
申请日期:2025-02-24
公开号:CN119992424A
公开日期:2025-05-13
类型:发明专利
摘要
本发明公开了一种基于多模态大模型灵活关联控制的图像问答方法,首先生成图像和对应文字描述的非关联性特征表示,然后生成图像和定制提示的关联性特征表示,计算每层非关联性特征表示和关联性特征表示的余弦距离,并根据余弦距离筛选得到关键层,对于每个关键层,通过其非关联性特征表示和关联性特征表示计算关联控制向量,在进行图像问答时,在关键层中应用对应的关联控制向量对生成特征表示进行关联控制,从而实现对多模态大模型的创造力和幻觉水平的动态控制。本发明采用灵活关联控制策略,无需额外训练就能高效地动态调节多模态大模型的关联能力,从而解决图像问答任务中的模型幻觉问题,显著增强了图像问答的准确性和创造性。
技术关键词
图像问答方法 多模态 生成特征 生成方法 控制策略 控制权 模板 代表 答案 因子 动态
系统为您推荐了相关专利信息
智能生成系统 人工智能模型 数据输入模块 功能模块 智能推荐技术
蒙特卡罗树搜索 多模态 蒙特卡洛 推理方法 知识构建方法
无人机编队 控制点 控制策略 无人机飞行姿态 姿态误差
互补系统 图像采集器 控制中心 链路 数据接收模块
保护控制方法 保护控制策略 运动状态判断 参数 发电机组控制技术