一种基于扩散模型快速优化的个性化图像生成方法及系统
申请号:CN202510102784
申请日期:2025-01-22
公开号:CN120198538A
公开日期:2025-06-24
类型:发明专利
摘要
本发明公开了一种基于扩散模型快速优化的个性化图像生成方法及系统,本发明的方法包括获取文本输入指令对应的文本特征向量,将预设的人物图像编码到文本空间得到新的文本特征,并通过替换文本特征和文本特征向量中的单词以生成包含特定人物的图像;根据不同的文本输入指令对包含特定人物的图像进行编码得到编码后人物图像;基于预设的名人名字对编码后人物图像进行重编码得到重编码人物图像;基于名人名字对文本输入指令的跟随能力构建名人条件正则化损失函数,以优化重编码人物图像得到最终的个性化人物图像。本发明可以实现在给定任意人脸图像和任意文字指令的情况下,生成符合文字指令且基于给定人脸身份信息的图像。
技术关键词
文本特征向量
图像生成方法
图像编码
指令
多模态
图像压缩编码器
文本编码器
图像生成系统
模型训练模块
人脸身份
解码器
编码模块
自然语言
特征值
定义