一种基于多模态大模型的印章检测和识别方法及系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于多模态大模型的印章检测和识别方法及系统
申请号:CN202511448053
申请日期:2025-10-11
公开号:CN120913186A
公开日期:2025-11-07
类型:发明专利
摘要
本发明公开了一种基于多模态大模型的印章检测和识别方法及系统,通过图像预处理模块对获取的文档图像数据进行尺寸标准化处理,生成符合多模态大模型输入规范的标准化图像;将标准化图像与结构化识别指令组合后输入经微调训练的多模态大模型进行端到端推理,输出符合JSON格式规范的识别结果字符串;通过对识别结果字符串解析提取每一印章对象的边界框坐标、类型标签、文字内容及文字识别置信度,并基于文字识别置信度进行分级决策处理,最终输出结构化识别结果。本发明显著提升了印章识别的准确率和自动化水平,确保了输出结果的规范性和可靠性,有效解决了复杂场景下印章识别精度低和输出非标准化的问题。
技术关键词
识别置信度 文档图像数据 印章 多模态 识别方法 格式 对象 强化学习算法 坐标 标签 在线增量学习 图像像素 指令 决策 模糊参数 推理机制 非标准化 解析算法