基于语义提取与图特征增强的非遗传承人视觉名片信息识别方法
申请号:CN202410877202
申请日期:2024-07-02
公开号:CN118692099A
公开日期:2024-09-24
类型:发明专利
摘要
本发明公开了基于语义提取与图特征增强的非遗传承人视觉名片信息识别方法,包括:通过整合公开网站的信息,构建非遗传承人视觉名片数据集;构建融合语义提取与图特征增强的视觉信息识别模型;利用所述非遗传承人视觉名片数据集对所述融合语义提取与图特征增强的视觉信息识别模型进行训练;将待测的非遗传承人视觉名片输入通过训练的所述融合语义提取与图特征增强的视觉信息识别模型,实现对待测的非遗传承人视觉名片信息的识别。本发明通过语义提取方法准确获得非遗传承人的文本嵌入信息,采用图特征增强方法增强模型的鲁棒性与特征学习能力,实现了对非遗传承人视觉名片信息的精准识别。
技术关键词
信息识别方法
视觉信息识别
名片
融合语义
语义提取方法
注意力机制
位置编码信息
节点特征
数据采集单元
矩阵
索引
网络单元
文本
语义特征
输出模块