一种基于自适应最小旋转矩形分割的OCR文本检测后处理方法
申请号:CN202510965089
申请日期:2025-07-14
公开号:CN120808353A
公开日期:2025-10-17
类型:发明专利
摘要
本发明公开了一种基于自适应最小旋转矩形分割的OCR文本检测后处理方法,属于计算机视觉与光学字符识别(OCR)技术领域;该方法针对弯曲文本检测中传统最小旋转矩形(MRR)拟合不精确的问题,提出动态优化机制:首先通过分割模型获取文本像素级掩码并提取连通组件;对每个组件拟合初始MRR后,构建优先级队列迭代处理;基于交并比(IoU)和尺寸双条件判断,当IoU≤动态阈值τ且短边≥时,沿长边中垂线二分切割生成子矩形;最终对重叠率>70%的相邻框执行融合操作;其中动态阈值τ=τ₀+k·C(弯曲度),通过轮廓点与拟合椭圆平均距离计算弯曲度值C。
技术关键词
后处理方法
检测协处理器
优先级调度策略
文本
工业OCR识别
矩形
OCR识别模型
向量运算单元
动态
弯曲
坐标
队列
光学字符识别
可读存储介质
图像采集器
存储计算机程序
轮廓
像素
计算机视觉
索引