隐式问题推理模型的训练方法和隐式问题推理方法

申请号：CN202510915797

申请日期：2025-07-03

公开号：CN120409712B

公开日期：2025-10-10

类型：发明专利

摘要

本申请提供了一种隐式问题推理模型的训练方法和隐式问题推理方法，可以应用于人工智能领域，该训练方法包括获取推理训练集；根据场景视频构建目标区域的三维模型；将场景视频和隐式问题输入至视觉语言模型，输出语义特征；将场景视频和语义特征输入至分割基础模型，输出多个掩码图像，掩码图像在与隐式问题对应的多个初始物体上形成有掩膜标签；利用感知融合模型处理多个掩码图像和语义特征，得到目标融合特征；利用预设语言模型处理三维模型、语义特征和目标融合特征，输出推理答案，初始推理模型包括视觉语言模型、分割基础模型、感知融合模型和预设语言模型；根据推理答案和答案标签对初始推理模型的模型参数进行调整，得到目标推理模型。

技术关键词

语义特征融合特征三维模型残差归一化答案感知特征场景物体视频图像编码交叉注意力机制特征提取器三维空间模型推理方法多层感知机输出特征变换特征标签