图像生成方法、装置、电子设备及可读存储介质

申请号：CN202410772854

申请日期：2024-06-14

公开号：CN118736038A

公开日期：2024-10-01

类型：发明专利

摘要

本申请涉及图像生成领域，提供了一种图像生成方法、装置、电子设备及可读存储介质。该方法包括：获取文本描述和图像信息，将所述文本描述和所述图像信息输入至多模态扩散模型；利用所述文本编码器对所述文本描述进行编码处理，得到第一特征向量，并利用所述图像编码器对所述图像信息进行编码处理，得到第二特征向量；利用所述至少一条件编码器对所述图像信息进行特征提取，得到至少一条件特征向量；将所述第一特征向量、所述第二特征向量以及所述至少一条件特征向量输入到所述扩散生成器，得到所述扩散生成器输出的目标图像。本申请可以改善现有模型生成的图像存在失真和模糊问题，提高生成图像的图像细节和真实性。

技术关键词

文本编码器图像编码器多语言图像生成方法人物特征多模态噪声图像空间结构特征图像生成装置训练集英语电子设备可读存储介质风格处理器