摘要
本申请公开了一种基于多模态协同的服装试穿方法、设备及存储介质,涉及图像处理技术领域,包括:基于预定义的文本提示词模板提取服装的关键特征描述,并结合服装参考图的服装风格特征,对模特姿态图进行局部编辑预处理,生成模特服装试穿图;基于服装参考图的服装风格特征,确定对应的服装类别作为识别提示词,识别模特服装试穿图中的服装边界框;基于服装边界框,将模特服装试穿图中服装区域与背景区域进行区分,生成相应的分割掩码图;提取模特服装试穿图和服装参考图的特征向量,并将分割掩码图作为区域标识,结合注意力机制调整特征权重,进行特征融合得到服装上身效果图。本申请达成了提高生成的服装上身效果图像的细节表现力的技术效果。