一种基于多标签扩散模型的宠物图像生成方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于多标签扩散模型的宠物图像生成方法
申请号:CN202411886813
申请日期:2024-12-20
公开号:CN119887973A
公开日期:2025-04-25
类型:发明专利
摘要
本发明公开了一种基于多标签扩散模型的宠物图像生成方法,涉及人工智能图像生成技术领域,所述方法包括:对待处理的宠物图像进行特征提取得到宠物图像特征图;对所述特征图输入下采样层进行下采样处理;将下采样处理后的图片信息输入至中间层;将中间层处理后的图片信息输入至上采样层;其中,所述下采样层和上采样层中包括多标签自适应模块,多标签自适应模块,包括:通过第一卷积模块;多标签向量联合叠加模块,第二卷积模块,注意力模块,自动捕捉多标签向量与中间特征之间的关联关系。增加了多标签编码模块和多标签自适应模块,用于引导扩散模型生成具备多标签特征的高质量宠物图像。
技术关键词
多标签 图像生成方法 人工智能图像 中间层 注意力 线性变换矩阵 编码模块 图片 生成技术 积层 体型 颜色 表达式 关系 数学 代表