LLM驱动的复杂报表OCR错误自校正方法及系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
LLM驱动的复杂报表OCR错误自校正方法及系统
申请号:CN202510902148
申请日期:2025-07-01
公开号:CN120412000B
公开日期:2025-08-29
类型:发明专利
摘要
本发明公开了LLM驱动的复杂报表OCR错误自校正方法及系统,包括如下步骤:S1、获取复杂报表图像数据,执行OCR处理,构建原始字段数据集;S2、提取上下文信息,识别语义矛盾字段,生成待校正字段集合;S3、指针生成网络生成多个字段修正候选,形成候选字段集合;S4、构建多臂老虎机模型,选择最优字段修正结果,形成修正字段输出集合;S5、执行版式分析,提取图表标题字段、图例字段与数据区域文本;S6、图表结构语义一致性机制,生成图表标题字段的修正字段结果;S7、字段还原与版式重建,输出结构化报表数据。本发明通过融合大语言模型、指针生成网络与多臂老虎机机制,实现了复杂报表中字段的智能纠错与结构化重建。
技术关键词
字段 校正方法 报表 多臂老虎机 执行光学字符识别 语义 生成图表 指针 大语言模型 文本 拉杆 因子 网络 二维图像数据 归因 解码器