基于多模态关联表征与实体对全局语义一致性的文本关系三元组抽取方法
申请号:CN202411381422
申请日期:2024-09-30
公开号:CN119166832A
公开日期:2024-12-20
类型:发明专利
摘要
本发明涉及一种基于多模态关联表征与实体对全局语义一致性的文本关系三元组抽取方法,包含轻量级实体对标签机制、基于全局语义与局部黏性的跨度表征、多模态token对关联表征、面向实体对的全局语义一致性约束、与边界双向映射的三元组解码。采用基于全局语义与局部黏性形成跨度的通用表征,并在嵌入关系前后两阶段分别建模多模态token对关联表征与关系token对全局语义一致性约束。此外,采用嵌入文本语义的关系表征,结合轻量化的双向映射解码机制完成关系三元组的一步抽取。与现有技术相比,本发明将跨度token间的黏性特性考虑在内,减小无关噪声实体对的生成概率的同时模型在训练时所占据资源更少,性能表现更佳。
技术关键词
三元组
语义
多模态
跨度
实体
关系
融合全局
文本
序列
编码
预训练语言模型
解码机制
参数
标签
两阶段
多任务
模式
策略