摘要
本发明公开了一种基于最小凸包及弗雷歇距离的边界框(bbox)合并算法,属于图像识别与文本处理技术领域。针对OCR系统中因文本换行或排版复杂导致的多个bbox错误拆分问题,本发明通过以下步骤实现精准合并:首先,动态配置滑动窗口以捕获目标bbox集合,利用QuickHull算法生成其最小凸包图形;其次,计算该凸包与预设标准图形(如三角形、四边形)的弗雷歇距离,结合x轴投影重叠长度阈值判定语义关联性;最终对符合条件的bbox进行纵向合并,并基于坐标均值或边界极值生成新坐标。本发明突破传统行间距依赖,通过几何相似性匹配提升合并准确性,尤其适用于医学检验报告、财务报表等复杂排版文档的OCR处理,有效解决字段信息失真问题。