摘要
本申请提出一种图像生成模型训练方法、装置、计算机设备及存储介质,该图像生成模型训练方法包括:预定义多个图像文本对;基于多个图像文本对训练得到初始生成模型的评估模型;评估模型用于评估初始生成模型的输出图像的图像质量以及语义一致性;对原始输入文本的三元组信息进行编码得到第一文本特征向量,对原始输入文本进行编码得到第二文本特征向量,将第一文本特征向量和第二文本特征向量进行融合得到融合文本特征向量;将融合文本特征向量输入至初始生成模型中得到目标图像;根据目标图像的评估值优化初始生成模型的模型参数,得到训练好的图像生成模型。本申请能够准确捕捉文本内容中的语义交互关系,使得生成图像的语义表达更加精准。