一种基于YOLOv8-Seg的增值税发票图像内容分割方法及系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于YOLOv8-Seg的增值税发票图像内容分割方法及系统
申请号:CN202411544045
申请日期:2024-10-31
公开号:CN119314194A
公开日期:2025-01-14
类型:发明专利
摘要
本发明公开了一种基于YOLOv8‑Seg的增值税发票图像内容分割方法及系统,引入小目标检测层使模型能够更精准地捕捉和定位发票中的小目标,有效提升对复杂发票的识别和检测能力。引入了C2f_DCN模块,融合可变形卷积,增强模型对图像中不同尺寸和形态目标的感知能力,能够更好地适应图像中的各种变化。引入了全局注意力GAM模块,加强模型的特征提取能力,引入SIoU损失作为边界框损失函数,解决CIoU计算中存在的准确性不高的问题,提升模型对目标定位的精度和稳定性。通过优化后续流程,实现了对发票文本对象的精确裁剪与识别,最后基于文字识别开源框架构建文字识别模型为处理和分析发票提供了准确且可靠的数据基础。
技术关键词
增值税发票图像 分割方法 数据获取模块 GAM模型 注意力 数据处理模块 可变形卷积层 特征提取能力 字段 可读存储介质 开源框架 分割系统 多层感知机 处理器 坐标 文本
系统为您推荐了相关专利信息
污染溯源方法 数值 加密数据 解密算法 RSA公钥
交叉注意力机制 影像 转换方法 特征提取网络 编码器
管理特征 综合能源管理 可再生能源 注意力 补偿值
跨模态 文本 异常检测方法 图像 多层次卷积神经网络
充放电数据 电极 频域特征 序列 锂电池