摘要
本发明涉及联邦学习、软件缺陷预测技术领域,公开了一种基于渐进训练的通信高效联邦学习的异构软件缺陷预测算法,解决了软件缺陷预测中多源训练通信与计算效率不佳以及隐私性问题。该方法包括:对各本地数据集采用最大互信息系数(maximal information coefficient,MIC)和Borderline Synthetic Minority Over‑sampling(Borderline‑SMOTE)过采样算法进行预处理;在训练阶段构建渐进训练策略(Progressive Training,PT),从浅层子模型开始训练,逐渐恢复模型复杂度,减少总体通信数据量;在通信阶段引入了降序量化算法(Descending Quantization,DQ),根据参数量和轮次动态分配量化水平,降低传输数据量的同时平衡模型性能。在迭代优化上采用了Ranger算法,其在参数更新上加入了多种不可逆的混合运算,因此能够在加速收敛的同时防止网络安全攻击截获原始数据。