摘要
本发明公开了一种面向检索增强生成系统的外部数据提取方法,包括接收用户查询数据,构建初始后缀序列数据,提取目标输出模板数据;基于初始后缀序列数据和目标输出模板数据计算位置损失数据和梯度矩阵数据;利用梯度矩阵数据选取候选词语并评估替换方案,生成候选词语数据和评估矩阵数据;根据评估矩阵数据选取最优替换方案并更新序列,生成优化后缀序列数据和梯度特征矩阵数据;基于优化后缀序列数据构建增强提示序列数据;通过分析过滤规则设计绕过方案,生成绕过策略集合数据和执行序列数据;最终整合处理生成提取数据集和完整性报告数据。本发明提高了数据提取的准确性和效率,增强了系统的鲁棒性。