摘要
本发明公开了基于增量预训练优化的知识检索候选库生成方法及系统,涉及信息检索技术领域,方法包括:收集第一检索语句并分析获取检索行为特征向量;计算获取归一化共现频率;构建映射函数关系获取匹配增量预训练级数;利用语句增量优化模型执行多级扩展第一检索语句输出扩展检索语句,进而生成知识检索候选库。本发明解决了在电数字数据处理中,传统知识检索候选库生成方法因无法基于用户检索行为特征动态调整增量预训练级数,导致语义覆盖不足、计算资源浪费且候选库生成不准的技术问题,达到了语义覆盖范围扩展、计算资源优化配置及候选库精准生成的技术效果。