摘要
本发明公开了文本驱动的针织产品图像生成与编辑方法及装置,涉及计算机图形领域,方法包括:S1,获取针织产品文本、编辑掩码和输入图像,将编辑掩码和参考图像进行拼接得到拼接图像;S2,构建包括多模态融合特征网络、多层去噪网络和针织图像重建网络的文本驱动的针织产品图像生成与编辑模型并进行训练,得到训练好的针织产品图像生成与编辑模型;S3,将针织产品文本、编辑掩码和参考图像输入训练好的文本驱动的针织产品图像生成与编辑模型,得到针织产品图像。本发明构建出的文本驱动的针织产品图像生成与编辑模型集成针织产品图像生成与编辑功能,简化了模型,实现了多模态特征的深度融合和对编辑指令的精准理解和执行。