摘要
本发明属于无监督深度学习方法技术领域,具体涉及一种基于合成数据生成的无监督深度学习方法,高斯混合模型寻找原始的无标签数据的聚类中心和标准差;贝叶斯优化通过衡量基于高斯混合模型聚类中心和标准差的各向同性高斯斑点生成数据与原始数据分布的差异,为高斯混合模型选择最优叠加权重;高斯混合模型在最优叠加权重下确定聚类数量与标准差,各向同性高斯斑点基于此聚类数量和标准差生成大量具备标签且具有平衡性的合成数据;合成数据用于训练深度神经网络模型;训练后的深度神经网络模型基于初始的无标签数据执行下游任务。实现了生成合成数据的样本均衡,辅助深度神经网络的训练,提升无监督学习场景下的模型精度。