基于目标检测与规则增强图文问答方法、装置及电子设备

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于目标检测与规则增强图文问答方法、装置及电子设备
申请号:CN202511434622
申请日期:2025-10-09
公开号:CN120892590A
公开日期:2025-11-04
类型:发明专利
摘要
本发明涉及数据处理技术领域,公开了一种基于目标检测与规则增强图文问答方法、装置及电子设备,其中,方法包括:获取并存储目标对象的多个基础图像;将基础图像输入到预先构建的目标检测模型,提取基础图像的第一特征数据;将第一特征数据输入到预先构建的规则增强模型,提取基础图像的第二特征数据;将第二特征数据转换成文本描述语句;根据多个基础图像以及多个文本描述语句生成多个图文描述对;响应于接收到针对目标对象的提问信息,将提问信息转换为目标语义向量,基于目标语义向量从多个图文描述对中检索出目标图文描述对,根据目标图文描述对生成针对提问信息的答复信息。本发明的方法,能够实现图像内容的深度理解与语义级问答。
技术关键词
图文 问答方法 语义向量 对象 图像 基础 空间约束条件 语句 文本 前端采集设备 关系 典型 电子设备 可读存储介质 问答装置 数据处理技术 处理器 程序 模式
系统为您推荐了相关专利信息
异常状态 工业相机 动态数据采集 智能算法 胶囊网络
非易失性存储介质 图像 视觉 文本 像素
场景三维重建方法 三维场景模型 影像传感器 网格 Delaunay三角剖分
电子设备 视频编解码模块 场景 软件算法模块 内存