一种基于扩散模型可推广的布局到图像生成方法
# 热门搜索 #
大模型
人工智能
openai
融资
chatGPT
AITNT公众号
AITNT APP
AITNT交流群
搜索
首页
AI资讯
AI技术研报
AI监管政策
AI产品测评
AI商业项目
AI产品热榜
AI专利库
寻求报道
一种基于扩散模型可推广的布局到图像生成方法
申请号:
CN202411847228
申请日期:
2024-12-16
公开号:
CN119722869B
公开日期:
2025-11-04
类型:
发明专利
摘要
本发明公开了一种基于扩散模型的可推广的布局到图像生成方法,其特点是该方法包括:构建符合自然语言表达的布局‑文本‑图片数据集;获取图像特征、文本特征和噪声图像特征;生成用于训练的语义布局特征;计算损失更新语义布局编码器参数;给定布局‑文本信息生成图片等步骤。本发明与现有技术相比具有可推广其他微调后的扩散模型上的能力,直接应用到使用个性化数据集进行微调后的扩散模型上,通过布局生成个性化的图片,并可以与其他基于扩散模型的可控生成方法一起使用,方法便捷,效果优异,具有良好的应用前景。
技术关键词
注意力地图
布局特征
图像生成方法
语义
噪声图像
图片
文本编码器
自然语言
大语言模型
生成图像特征
交叉注意力机制
多模态
编码器参数
图像编码器