一种文本流实体同义词实时挖掘方法及装置

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种文本流实体同义词实时挖掘方法及装置
申请号:CN202410944222
申请日期:2024-07-15
公开号:CN119067104A
公开日期:2024-12-03
类型:发明专利
摘要
本发明涉及同义词识别技术领域,具体涉及一种文本流实体同义词实时挖掘方法及装置,本发明利用预训练语言模型从实体提及的多个上下文中提取实体提及嵌入,能够捕捉多角度的实体提及上下文语义;本发明利用Transformer的多头子注意力机制,从提取的实体提及嵌入中学习集合特征,能够更好的捕捉集合的全局语义,在一定程度上能够缓解错误累积问题;本发明能够读取文本流,实时的从文本流中挖掘实体同义词集合,相比传统方法的离线操作,更加灵活高效。
技术关键词
同义词 挖掘方法 文本 sigmoid函数 样本 序列 注意力机制 种子 预训练语言模型 挖掘实体 打分器 多层感知机 挖掘装置 编码器 数据 哈希表 元素 输出模块 语义