一种基于YOLOv8-Seg的增值税发票图像内容分割方法及系统
申请号:CN202411544045
申请日期:2024-10-31
公开号:CN119314194A
公开日期:2025-01-14
类型:发明专利
摘要
本发明公开了一种基于YOLOv8‑Seg的增值税发票图像内容分割方法及系统,引入小目标检测层使模型能够更精准地捕捉和定位发票中的小目标,有效提升对复杂发票的识别和检测能力。引入了C2f_DCN模块,融合可变形卷积,增强模型对图像中不同尺寸和形态目标的感知能力,能够更好地适应图像中的各种变化。引入了全局注意力GAM模块,加强模型的特征提取能力,引入SIoU损失作为边界框损失函数,解决CIoU计算中存在的准确性不高的问题,提升模型对目标定位的精度和稳定性。通过优化后续流程,实现了对发票文本对象的精确裁剪与识别,最后基于文字识别开源框架构建文字识别模型为处理和分析发票提供了准确且可靠的数据基础。
技术关键词
增值税发票图像
分割方法
数据获取模块
GAM模型
注意力
数据处理模块
可变形卷积层
特征提取能力
字段
可读存储介质
开源框架
分割系统
多层感知机
处理器
坐标
文本