摘要
本发明涉及图像处理领域,具体涉及一种文本引导的零样本透明图层及分层图像生成方法,分层图像生成方法包括:输入全局图像文本提示、目标图像尺寸及层文本提示到前景位置信息生成模型,得到前景位置信息;为每个层文本提示生成第一目标图像;根据所有第一目标图像的透明通道,生成软分割掩码;叠加所有第一目标图像,并编码到潜在空间,得到前景叠加潜在特征;随机采样高斯噪声作为初始背景潜在特征。根据软分割掩码,在迭代式去噪过程中混合前景叠加潜在特征与初始背景潜在特征,得到全局图像潜在特征,并解码为第二目标图像。本发明对每个主体对象的位置进行精准控制,增强了模型的图像布局能力;免去了模型训练的步骤,极大节省计算资源。