摘要
本公开实施例提供一种文档处理方法、装置、电子设备及存储介质,通过获取待处理文本,并对待处理文本进行处理,得到包含多个待处理词源的有序词源集;通过组合识别模型处理待处理词源,得到待处理文本对应的异常词,异常词为在待处理文本中未进行解释的不易理解词;基于异常词,生成对应的注释信息,注释信息至少用于指示异常词在待处理文本中的位置。通过将待处理文件分解为待处理词源,并通过组合识别模型对待处理词源进行检测和识别,确定待处理文本中的异常词,并生成对应的注释信息,实现对待处理文本中异常词的高效检测和识别,提高异常词检测效率,进而提高针对文档进行编辑和处理的效率和质量,提高用户使用体验。