摘要
本发明涉及人工智能领域的一种增强图像多样性的深度生成模型,含风格特征提取器Ex、风格特定多机制生成器、图像风格编码器Es和域特定判别器D。Ex从高斯分布采样噪声向量,经多层全连接映射输出多个风格特征向量。包括共享的编码层和风格特定的解码层,前者通过下采样网络提取图像内容,后者采用多分支并行上采样设计,各分支融合一个风格特征向量以输出对应风格生成图像。Es提取生成图像风格特征并与参考风格特征向量比较,还提取原图像特征,与生成样本融合后和原始样本比较。D采用多分支输出设计,用于输出D输入图像属于对应图像域的概率,并实现生成的图像均匀分布于多个图像域。模型可跨多图像域,增强各域内生成图像多样性。