摘要
本发明提供了一种基于半监督联邦学习的铁路内部数据流通共享方法,涉及半监督技术领域,包括从多个客户端上获取多个初始本地模型;得到初始全局模型;对无标签数据集中的每个无标签数据分配伪标签;得到多个本地模型;对每个本地模型分配对应的权重参数;得到数据共享模型。本发明通过基于标签数据集训练得到的模型,为无标签数据分配伪标签,使得无标签数据能够参与到后续的模型训练中,进一步扩充了训练数据的规模,提高模型的泛化能力;以及基于每个客户端上数据的聚类分布对每个本地模型分配对应的权重参数,从而反映各个本地模型在数据共享模型中的重要性,使得最终得到的数据共享模型既能够兼顾全局的共性,又能够体现不同客户端的个性。