摘要
本申请涉及图像生成领域,提供了一种图像生成方法、装置、电子设备及可读存储介质。该方法包括:获取文本描述和图像信息,将所述文本描述和所述图像信息输入至多模态扩散模型;利用所述文本编码器对所述文本描述进行编码处理,得到第一特征向量,并利用所述图像编码器对所述图像信息进行编码处理,得到第二特征向量;利用所述至少一条件编码器对所述图像信息进行特征提取,得到至少一条件特征向量;将所述第一特征向量、所述第二特征向量以及所述至少一条件特征向量输入到所述扩散生成器,得到所述扩散生成器输出的目标图像。本申请可以改善现有模型生成的图像存在失真和模糊问题,提高生成图像的图像细节和真实性。