摘要
本发明提供了一种图像生成方法、装置和电子设备;其中,方法包括:获取引导信号;其中,引导信号包括:文本描述信号和图像指示信号;图像指示信号对应有预设的参考图像;提取文本描述信号的第一语义特征、参考图像的第二语义特征以及参考图像的图像视觉特征;对第二语义特征和图像视觉特征进行特征融合,得到参考图像对应的融合特征;提取融合特征与第一语义特征之间的关系,得到关系特征;基于第一语义特征、融合特征和关系特征,对预设的噪声图像进行去噪处理,得到输出图像。该方式使得输出图像内容更精确且与用户意图的匹配性较高,从而提高了图像处理的控制灵活性和精确度,提高了图像处理质量。