一种基于PaddleOCR的复杂背景图像文字检测与增强系统及方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于PaddleOCR的复杂背景图像文字检测与增强系统及方法
申请号:CN202411715465
申请日期:2024-11-27
公开号:CN119625743A
公开日期:2025-03-14
类型:发明专利
摘要
本发明涉及图像文字处理技术领域,尤其涉及一种基于PaddleOCR的复杂背景图像文字检测与增强系统及方法,包括:通过批量读取指定目录下的图像文件,利用PaddleOCR模型进行初步文字检测与识别,提取文字边界框及其对应的文字内容,并计算每个文字的中心位置。基于初步识别结果,系统进一步分析字符特征,包括平均字符宽度、平均字符高度及字符间距,以推测图像中可能存在但未被初步识别的文字区域位置。对于预测的潜在文字区域,系统进行图像增强处理,对比度增强和直方图均衡化,并再次应用OCR模型进行文字识别,持续补充新的识别结果。本发明显著提升了OCR的识别率和处理效果,适用于复杂背景、商品包装、食品检测机构成分识别等。
技术关键词
对比度 图像文字处理技术 直方图均衡化 图像增强 颜色 平均字符宽度 生成感兴趣区域 食品检测机构 文字识别算法 识别模块 OCR系统 间距 层级 聚类技术 目录 商品包装
系统为您推荐了相关专利信息
数据处理控制 成像模块 计数方法 钢板端面 计数系统
无缝钢管缺陷 滤波器 支持向量机分类器 图像处理 形态学特征
渗漏水 巡检机器 激光雷达点云数据 隧道结构 机器狗
安装工艺流程 三维模型 手持终端 二维码 船舶设计软件
行程测量方法 特征点集合 图像增强模型 电梯导轨 机器视觉技术