摘要
本申请涉及图像处理、光学字符识别和自然语言处理领域,公开了基于图像识别进行蒙语电力表格数据提取的方法和系统,该方法包括以下步骤:对输入的电力表格图像样本进行图像预处理,提升图像质量;提取表格框架结构,优化表格线段位置,并分割出表格单元格;识别出各个单元格对应的电力业务字段并建立单元格和电力业务字段的映射关系;基于所述映射关系,生成结构化的电子表格数据,并将所述电力业务数据填充到所述结构化电子表格数据中。本发明通过引入表格结构优化、上下文关联字符提取及行业术语校正技术,有效提高了蒙语表格数据处理的效率与准确性,为电力行业的数字化管理和少数民族语言智能化应用提供了技术支持。