摘要
本发明公开了一种基于联邦学习的多源RAG路由增强检索方法,用于在多数据源场景中提升模型生成质量与保护数据隐私。首先,客户端对查询请求与本地元数据进行语义编码,并通过轻量级查询路由选择器评估各数据源与查询请求之间的语义相关性,选取相关Top‑k数据进行增强检索,客户端小模型基于选取的数据生成响应结果;然后,客户端基于LoRA技术对本地小模型进行参数微调,同时基于本地数据源训练优化更新路由选择器的参数,并上传至服务器端;最后,服务器端分别对模型微调和路由选择器参数进行加权平均聚合与稀疏化处理后,将全局更新参数同步下发至客户端。本发明在提升跨源检索准确性的同时,有效保护数据隐私并降低模型更新的通信开销。