基于分化注意力和去噪过程引导的多目标图像生成方法

申请号：CN202411591540

申请日期：2024-11-08

公开号：CN119722833B

公开日期：2025-11-18

类型：发明专利

摘要

本发明公开了一种基于分化注意力和去噪过程引导的多目标图像生成方法，其步骤包括：1)针对给定包括N个目标词的文本提示y以及一初始隐编码zT，利用稳定扩散模型生成文本提示y中每一目标词与zT之间的交叉注意力图CAT；2)通过设定损失函数优化初始隐编码zT；3)稳定扩散模型生成文本提示y中每一目标词与优化后的初始隐编码zT之间的最优交叉注意力图4)稳定扩散模型对优化后的初始隐编码zT进行迭代去噪并对设定时间步生成的交叉注意力图进行插值；然后对迭代去噪结束所得隐编码z0进行解码生成该文本提示y对应的图像。本发明有效提高生成图像与给定文本提示之间的语义匹配性。

技术关键词

注意力图像生成方法编码损失函数优化文本存储计算机程序处理器可读存储介质解码存储器服务器语义指令参数