图文问答处理方法、电子设备及计算机可读存储介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
图文问答处理方法、电子设备及计算机可读存储介质
申请号:CN202511221110
申请日期:2025-08-29
公开号:CN120725162B
公开日期:2025-11-14
类型:发明专利
摘要
本申请实施例提供一种图文问答处理方法、电子设备及计算机可读存储介质。涉及人工智能领域,该方法包括:获取问题信息;基于多个目标图像分别进行语义提取,生成多个目标图像分别对应的图像描述信息;分别在各图像描述信息包括的多个候选描述元素中,确定与语料元素相匹配的目标描述元素;按照同一语料元素分别与不同目标图像的目标描述元素之间的第一对应关系,确定属于不同目标图像的目标子图区域之间的第二对应关系,目标描述元素与目标子图区域相对应;依据问题信息、图像描述信息、第一对应关系以及第二对应关系,得到问题信息的回答结果。本申请解决了相关技术难以捕捉文本和图像之间关联,导致问答结果准确性不足的技术问题。
技术关键词
元素 阶段 可读存储介质 关系 语义 正确率 电子设备 图文 文本 图像嵌入 计算机 数据 训练集 处理器 存储器 视频 样本 意图 链路