一种基于伪孪生去噪网络的中文实体关系联合抽取方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于伪孪生去噪网络的中文实体关系联合抽取方法
申请号:CN202410798676
申请日期:2024-06-20
公开号:CN118839691A
公开日期:2024-10-25
类型:发明专利
摘要
本发明公开了一种基于伪孪生去噪网络的中文实体关系联合抽取方法,为弥补联合抽取任务对于语境信息和句法信息利用不充分问题,首先引入文本词性信息和依存句法信息进行先验特征学习,对生成的文本词性特征向量、文本语义特征向量和依存句法特征向量进行拼接和特征降维;将去噪门机制整合到孪生网络中,形成伪孪生网络,将特征降维后的特征向量分别输入到孪生网络和伪孪生网络中,对孪生网络获得的原始特征和伪孪生网络产生的去噪特征进行残差连接,形成伪孪生去噪网络,防止信息损失,并将其输入到关系导向网络执行联合抽取任务。通过伪孪生去噪网络可以很大程度上处理表示学习过程中产生的噪音特征,以此缓解一词多义和歧义问题造成的性能损失。
技术关键词
网络 高维特征向量 序列 实体 依存句法分析 文本编码器 预训练模型 工具包 语义 注意力机制 生成特征向量 词语 分词 线性 关系