基于目标检测与规则增强图文问答方法、装置及电子设备
申请号:CN202511434622
申请日期:2025-10-09
公开号:CN120892590A
公开日期:2025-11-04
类型:发明专利
摘要
本发明涉及数据处理技术领域,公开了一种基于目标检测与规则增强图文问答方法、装置及电子设备,其中,方法包括:获取并存储目标对象的多个基础图像;将基础图像输入到预先构建的目标检测模型,提取基础图像的第一特征数据;将第一特征数据输入到预先构建的规则增强模型,提取基础图像的第二特征数据;将第二特征数据转换成文本描述语句;根据多个基础图像以及多个文本描述语句生成多个图文描述对;响应于接收到针对目标对象的提问信息,将提问信息转换为目标语义向量,基于目标语义向量从多个图文描述对中检索出目标图文描述对,根据目标图文描述对生成针对提问信息的答复信息。本发明的方法,能够实现图像内容的深度理解与语义级问答。
技术关键词
图文
问答方法
语义向量
对象
图像
基础
空间约束条件
语句
文本
前端采集设备
关系
典型
电子设备
可读存储介质
问答装置
数据处理技术
处理器
程序
模式