一种基于最小凸包及弗雷歇距离的bbox合并算法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于最小凸包及弗雷歇距离的bbox合并算法
申请号:CN202510641118
申请日期:2025-05-19
公开号:CN120510618A
公开日期:2025-08-19
类型:发明专利
摘要
本发明公开了一种基于最小凸包及弗雷歇距离的边界框(bbox)合并算法,属于图像识别与文本处理技术领域。针对OCR系统中因文本换行或排版复杂导致的多个bbox错误拆分问题,本发明通过以下步骤实现精准合并:首先,动态配置滑动窗口以捕获目标bbox集合,利用QuickHull算法生成其最小凸包图形;其次,计算该凸包与预设标准图形(如三角形、四边形)的弗雷歇距离,结合x轴投影重叠长度阈值判定语义关联性;最终对符合条件的bbox进行纵向合并,并基于坐标均值或边界极值生成新坐标。本发明突破传统行间距依赖,通过几何相似性匹配提升合并准确性,尤其适用于医学检验报告、财务报表等复杂排版文档的OCR处理,有效解决字段信息失真问题。
技术关键词
合并算法 滑动窗口 医学检验报告 文本处理技术 OCR系统 图像识别系统 排版文档 超参数 坐标点 四边形 文本行 三角形 处理器 可读存储介质 存储器 六边形