一种基于上下文与掩模集成模块的多模态服装图像生成方法
申请号:CN202510184815
申请日期:2025-02-19
公开号:CN120298517A
公开日期:2025-07-11
类型:发明专利
摘要
本发明涉及一种基于上下文与掩模集成模块的多模态服装图像生成方法,本发明的上下文与掩模集成模块整合了先进的Mamba卷积层和掩模自适应交叉注意力机制,首先,Mamba卷积层高效地捕捉局部和全局上下文信息,缓解了传统自注意力机制固有的计算效率问题,其次,MACA机制根据输入掩模调整注意力权重,增强了模型对关键视觉特征的响应,并聚焦于将掩模模态与其他模态对齐。这一双重机制确保模型能够准确理解和匹配复杂设计元素之间的依赖关系,从而提高生成图像的精度和一致性。通过CM IM的设计,我们能够生成精确的边界框,定义每个服装元素的位置和大小,这些边界框随后输入扩散模型以生成最终的高质量服装设计图像。
技术关键词
集成模块
图像生成方法
交叉注意力机制
视觉特征
掩模
文本编码器
服装
融合特征
输入解码器
多模态特征
语义
矩阵
随机噪声