摘要
本发明公开了一种智能数据标注方法及系统,涉及文本处理技术领域,包括:数据采集模块,所述数据采集模块获取等待标注的文本文档集;数据预处理模块。通过设置分布式集群模块、智能引擎处理模块和智能引擎分析模块,使用计算机系统对等待标注的文本文档集进行处理,提升处理速度,减轻人力,同时,建立数据分析包和文本待标注示意,根据数据分析包,对文本作出分析,判断文本需要标注的信息,文本需要标注的信息包括有生僻词语、专业术语以及成语词汇等,接着匹配文本标注,对生僻词语、专业术语以及成语词汇等做出高精度的延伸解释,此外,可视化模块将文本标注可视化呈现,便于阅读者记忆。