基于大模型抽取与术语对齐的查新检索式构建方法及装置
申请号:CN202411088368
申请日期:2024-08-09
公开号:CN119166745A
公开日期:2024-12-20
类型:发明专利
摘要
本发明属于计算机技术领域,具体涉及一种基于大模型抽取与术语对齐的查新检索式构建方法及装置,包括:基于历史论文迭代构建术语库;基于大模型信息抽取获取与查新点相关的不同分面初始检索词;基于SPO结构识别初始检索词的关系构建初始检索式,在本地论文库实施初步检索获取相关论文;基于初始检索式与论文句子的相似度以及初始检索词与术语库术语之间的相关性构建候选检索词集;判断候选检索式与初始检索式是否为相近领域,为相近领域时将其作为标准检索词;将不同分面的标准检索词组合,得到不同长度的检索式。本发明能够自动生成高质量多位面的查新检索式,提升科技查新的效率和质量。
技术关键词
术语
论文
BERT模型
依存句法分析
抽取关键词
词语
文本
分类器
预测类别
模块
摘要
处理器
关系
可读存储介质
存储器
电子设备
字段
列表
格式