文本驱动的针织产品图像生成与编辑方法及装置

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
文本驱动的针织产品图像生成与编辑方法及装置
申请号:CN202510680668
申请日期:2025-05-26
公开号:CN120198548B
公开日期:2025-08-05
类型:发明专利
摘要
本发明公开了文本驱动的针织产品图像生成与编辑方法及装置,涉及计算机图形领域,方法包括:S1,获取针织产品文本、编辑掩码和输入图像,将编辑掩码和参考图像进行拼接得到拼接图像;S2,构建包括多模态融合特征网络、多层去噪网络和针织图像重建网络的文本驱动的针织产品图像生成与编辑模型并进行训练,得到训练好的针织产品图像生成与编辑模型;S3,将针织产品文本、编辑掩码和参考图像输入训练好的文本驱动的针织产品图像生成与编辑模型,得到针织产品图像。本发明构建出的文本驱动的针织产品图像生成与编辑模型集成针织产品图像生成与编辑功能,简化了模型,实现了多模态特征的深度融合和对编辑指令的精准理解和执行。
技术关键词
针织产品 融合特征 编辑方法 多模态特征 多层次 图像重建 文本 采样模块 网络 编码器 多尺度特征融合 注意力 上采样 噪声 编辑装置