一种基于扩散模型的定制化图像方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于扩散模型的定制化图像方法
申请号:CN202411946912
申请日期:2024-12-27
公开号:CN119887824A
公开日期:2025-04-25
类型:发明专利
摘要
本发明公开一种基于扩散模型的定制化图像方法,引入图像编码器模块,注入图像先验信息,不仅能够提升生成图像中物体与参考物体的一致性,而且需要优化模型参数以及计算成本很少,降低时间和算例成本。采用一种轻量化的身份一致性网络对参考物体进行特征提取,降低模型所需优化的参数量。利用掩码衰减的损失保证一致性的同时,减少背景信息的干扰。为提升文本对参考物体的可编辑性,引入文本先验和文本保护机制,利用未加入标识向量的文本作为学习目标,减小除标识向量之外的其余向量之间的差距,采用向量正交分解的方式进行文本保护。本发明的方法能更广泛地应用于实际场景中,参考物体的身份一致性较高,同时对于参考物体的属性,可编辑性较高。
技术关键词
物体 图像编码器 标识 噪声图像 编辑 文本编码器 图像分割器 多层感知机 网络 像素点 注意力机制 身份 解码器 词典