一种基于稳定扩散模型的车辆图像生成方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于稳定扩散模型的车辆图像生成方法
申请号:CN202411059330
申请日期:2024-08-03
公开号:CN119107377A
公开日期:2024-12-10
类型:发明专利
摘要
本发明公开了一种针对交通车辆图像生成任务的基于稳定扩散模型的生成方法,该方法能够提升文本语义与生成图像语义相似度,使生成图像满足我国实际道路车辆风格,同时提升图像生成图像的真实性与多样性,并对文本生成图像生成效率进行优化。该方法首先对文本与图像语义一致性问题进行建模,并据此建立语义对齐增强算法过程;接着通过多阶段训练进行模型方案的制定;最后将模型训练至收敛并确定调度方案。本发明在文本生成图像任务具有出色的表现,在评价生成任务上的各方面性能都较基线方法有了一定提升。
技术关键词
图像生成方法 图像去噪模型 语义 文本生成图像 车辆图像数据 注意力 深度学习模型 交通道路 交通车辆 关键词 车型 指图像 算法 表达式 多阶段 图像块