摘要
本发明提供一种融合汝瓷知识图谱与微调控制的汝瓷图像生成方法,包括构建汝瓷知识图谱,并基于汝瓷知识图谱利用大语言模型生成提示词;构建改进的汝瓷图像生成模型,并利用汝瓷图像数据集对其进行训练;训练好的改进的汝瓷图像生成模型根据提示词生成汝瓷图像,并采用多模态大模型Janus对改进的模型生成的汝瓷图像进行评估。本发明结合LoRA与ControlNet构建适用于汝瓷图像生成的轻量化模型;LoRA模块用于调节交叉注意力层参数,精细复现汝瓷的纹理与釉色特征;ControlNet模块则用于器型与姿态的结构控制,确保图像形态准确;引入多模态大模型对生成图像进行图像评估并根据评估结果对提示词进行优化。