一种上下文感知的词汇识别模型训练方法及系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种上下文感知的词汇识别模型训练方法及系统
申请号:CN202510660282
申请日期:2025-05-22
公开号:CN120218066B
公开日期:2025-09-02
类型:发明专利
摘要
本发明公开了一种上下文感知的词汇识别模型训练方法及系统,涉及词汇定义识别技术领域,包括如下步骤:构建词汇词库,同时基于词汇定义构建三元组表;使用语义识别模型对样本文章进行语义识别,得到正确语义,基于正确语义分析不同词语之间的词汇关联性;获取目标词汇的上下文,提取上下文的文章分词;基于文章分词以及文章分词所处的位置分析词汇定义的关联占比,再对目标词汇的词汇定义进行识别,并检测词汇识别模型是否有效;本发明用于解决现有的词汇定义识别技术还存在对单一领域的词汇进行识别,导致判断结果出现偏差且词汇识别的准确率稍显不足的问题。
技术关键词
识别模型训练方法 文章 语义 分词 检测词汇 词语 定义 标记 样本 三元组 文档校对技术 关键词提取技术 期刊 信号 识别模块 分析模块 杂志 实体