摘要
本发明公开了一种上下文感知的词汇识别模型训练方法及系统,涉及词汇定义识别技术领域,包括如下步骤:构建词汇词库,同时基于词汇定义构建三元组表;使用语义识别模型对样本文章进行语义识别,得到正确语义,基于正确语义分析不同词语之间的词汇关联性;获取目标词汇的上下文,提取上下文的文章分词;基于文章分词以及文章分词所处的位置分析词汇定义的关联占比,再对目标词汇的词汇定义进行识别,并检测词汇识别模型是否有效;本发明用于解决现有的词汇定义识别技术还存在对单一领域的词汇进行识别,导致判断结果出现偏差且词汇识别的准确率稍显不足的问题。