一种基于视觉语言模型的模型推理方法及装置

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于视觉语言模型的模型推理方法及装置
申请号:CN202510216160
申请日期:2025-02-26
公开号:CN119721259B
公开日期:2025-05-02
类型:发明专利
摘要
本发明公开了一种基于视觉语言模型的模型推理方法及装置,涉及人工智能技术领域。所述方法包括:对待推理文本和待推理图像进行编码,生成初始推理树;基于推理动作在待推理图像中的可行性参数以及当前节点的状态参数,对初始推理树进行扩展更新处理,生成目标推理树;基于目标推理树中所有结束节点的合理性参数,确定出候选推理路径;根据候选推理路径中的中间节点的一致性参数以及结束节点的合理性参数,确定目标推理路径,最后通过目标推理路径输出目标响应数据。本发明可以提升视觉语言模型在复杂推理任务中的推理效率及准确性。
技术关键词
节点 参数 视觉 图像 推理方法 数据 文本 摘要 推理装置 人工智能技术 聚类 模块 模板 编码 基础 逻辑