基于目标检测与规则增强图文问答方法、装置及电子设备

申请号：CN202511434622

申请日期：2025-10-09

公开号：CN120892590A

公开日期：2025-11-04

类型：发明专利

摘要

本发明涉及数据处理技术领域，公开了一种基于目标检测与规则增强图文问答方法、装置及电子设备，其中，方法包括：获取并存储目标对象的多个基础图像；将基础图像输入到预先构建的目标检测模型，提取基础图像的第一特征数据；将第一特征数据输入到预先构建的规则增强模型，提取基础图像的第二特征数据；将第二特征数据转换成文本描述语句；根据多个基础图像以及多个文本描述语句生成多个图文描述对；响应于接收到针对目标对象的提问信息，将提问信息转换为目标语义向量，基于目标语义向量从多个图文描述对中检索出目标图文描述对，根据目标图文描述对生成针对提问信息的答复信息。本发明的方法，能够实现图像内容的深度理解与语义级问答。

技术关键词

图文问答方法语义向量对象图像基础空间约束条件语句文本前端采集设备关系典型电子设备可读存储介质问答装置数据处理技术处理器程序模式