摘要
本发明涉及联邦学习、软件缺陷预测技术领域,公开了一种基于继承联邦学习的异构软件缺陷预测方法,解决了软件缺陷预测中单一数据集的数据不充分以及多源数据带来的数据异构和隐私性问题。该方法包括:对各本地数据集采用综合过采样Synthetic Minority Over‑sampling Technique combined with Tomek Links(SMOTETomek)算法和核主成分分析(Kernel Principal Component Analysis,KPCA)算法进行预处理;在本地训练阶段加入继承私有模型(Inherited Private Models,IPM),将历史训练中的模型知识进行迁移,共同参与本轮训练;在全局聚合阶段引入差异感知协作(Discrepancy‑aware Collaboration,DC)算法,考虑数据分布的情况下重新分配聚合权重。在迭代优化上采用了Ranger算法,由于参数更新上加入了多种不可逆的混合运算,因此能够加速收敛的同时有效保护数据隐私安全。