一种融合汝瓷知识图谱与微调控制的汝瓷图像生成方法

申请号：CN202510536528

申请日期：2025-04-27

公开号：CN120451310A

公开日期：2025-08-08

类型：发明专利

摘要

本发明提供一种融合汝瓷知识图谱与微调控制的汝瓷图像生成方法，包括构建汝瓷知识图谱，并基于汝瓷知识图谱利用大语言模型生成提示词；构建改进的汝瓷图像生成模型，并利用汝瓷图像数据集对其进行训练；训练好的改进的汝瓷图像生成模型根据提示词生成汝瓷图像，并采用多模态大模型Janus对改进的模型生成的汝瓷图像进行评估。本发明结合LoRA与ControlNet构建适用于汝瓷图像生成的轻量化模型；LoRA模块用于调节交叉注意力层参数，精细复现汝瓷的纹理与釉色特征；ControlNet模块则用于器型与姿态的结构控制，确保图像形态准确；引入多模态大模型对生成图像进行图像评估并根据评估结果对提示词进行优化。

技术关键词

图像生成方法图谱图像生成模型大语言模型关键词生成提示词矩阵识别自然语言交叉注意力机制多模态语义绑定结构文本编码器优化器图像评估模块图像压缩