一种基于扩散模型的定制化图像方法

申请号：CN202411946912

申请日期：2024-12-27

公开号：CN119887824A

公开日期：2025-04-25

类型：发明专利

摘要

本发明公开一种基于扩散模型的定制化图像方法，引入图像编码器模块，注入图像先验信息，不仅能够提升生成图像中物体与参考物体的一致性，而且需要优化模型参数以及计算成本很少，降低时间和算例成本。采用一种轻量化的身份一致性网络对参考物体进行特征提取，降低模型所需优化的参数量。利用掩码衰减的损失保证一致性的同时，减少背景信息的干扰。为提升文本对参考物体的可编辑性，引入文本先验和文本保护机制，利用未加入标识向量的文本作为学习目标，减小除标识向量之外的其余向量之间的差距，采用向量正交分解的方式进行文本保护。本发明的方法能更广泛地应用于实际场景中，参考物体的身份一致性较高，同时对于参考物体的属性，可编辑性较高。

技术关键词

物体图像编码器标识噪声图像编辑文本编码器图像分割器多层感知机网络像素点注意力机制身份解码器词典