图像信息识别方法及装置

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
图像信息识别方法及装置
申请号:CN202510666429
申请日期:2025-05-22
公开号:CN120564204A
公开日期:2025-08-29
类型:发明专利
摘要
本公开提供了一种图像信息识别方法及装置。该方法包括:获取单据图像;对单据图像进行光学字符识别,得到结构化文本信息;通过多模态信息识别大模型预测得到单据图像对应的多模态识别信息;确定结构化文本信息与多模态识别信息的相似度,在相似度满足信息相似度验证条件的情况下,基于单据图像对应的结构化文本信息与单据图像对应的多模态识别信息确定目标图像信息。上述技术方案,通过将光学字符识别与大模型预测的两种识别结果融合,提升了图像识别结果的准确度,并通过相似度验证增加了识别过程的冗余性,即使其中一个识别方法出现错误,也能通过另一个识别方法进行验证,从而提高了识别结果的可靠性。
技术关键词
单据 文本 多模态信息 光学字符识别 图像信息识别方法 布局 视觉 图像增强 信息识别装置 凭证 命名实体识别 语义 关系 图像获取模块 自然语言 识别模块