摘要
本发明公开了一种基于生僻字的标准化处理方法及系统,涉及字符识别处理技术领域,包括,获取输入文本数据进行预处理并统一文本数据格式,建立标准化字典表进行疑似生僻字标记;基于疑似生僻字标记提取多模态文字特征综合识别生僻字,转化已识别的生僻字,并将未识别的生僻字形成列表输出;展示生僻字识别结果并将识别结果进行存储。本发明通过获取用户输入文本数据进行预处理并标记疑似生僻字,降低生僻字识别处理量,提高识别效率,同时通过提取生僻字多模态特征向量进行生僻字综合识别,大幅提高生僻字识别准确性和灵活性,实现了生僻字的精准识别和提取。