一种基于PaddleOCR的复杂背景图像文字检测与增强系统及方法
申请号:CN202411715465
申请日期:2024-11-27
公开号:CN119625743A
公开日期:2025-03-14
类型:发明专利
摘要
本发明涉及图像文字处理技术领域,尤其涉及一种基于PaddleOCR的复杂背景图像文字检测与增强系统及方法,包括:通过批量读取指定目录下的图像文件,利用PaddleOCR模型进行初步文字检测与识别,提取文字边界框及其对应的文字内容,并计算每个文字的中心位置。基于初步识别结果,系统进一步分析字符特征,包括平均字符宽度、平均字符高度及字符间距,以推测图像中可能存在但未被初步识别的文字区域位置。对于预测的潜在文字区域,系统进行图像增强处理,对比度增强和直方图均衡化,并再次应用OCR模型进行文字识别,持续补充新的识别结果。本发明显著提升了OCR的识别率和处理效果,适用于复杂背景、商品包装、食品检测机构成分识别等。
技术关键词
对比度
图像文字处理技术
直方图均衡化
图像增强
颜色
平均字符宽度
生成感兴趣区域
食品检测机构
文字识别算法
识别模块
OCR系统
间距
层级
聚类技术
目录
商品包装