摘要
本发明公开了基于预训练模型和词义增强的事件抽取系统及方法,领域词向量获取模块得到领域词向量;数据集构造模块获取特定领域文本序列数据集;事件抽取模型构造模块构建事件抽取模型;训练模块将领域词向量作为事件抽取模型中Soft‑lexicon子模型中训练的初始设置,并利用已标注特定领域文本序列数据集对事件抽取模型进行训练;事件抽取模块利用训练好的事件抽取模型预测待检测特定领域文本序列数据集的标签序列结果。本发明通过利用预训练LERT子模型和利用Soft‑lexicon子模型将领域词向量的领域词汇信息纳入字符表示,并在模型中引入CRF层,提高事件抽取任务中标签标注的准确性,解决了特定领域事件抽取中,标注数据稀缺和专业性强、语境复杂的问题。