文本引导的零样本透明图层及分层图像生成方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
文本引导的零样本透明图层及分层图像生成方法
申请号:CN202510202270
申请日期:2025-02-24
公开号:CN120070638B
公开日期:2025-11-25
类型:发明专利
摘要
本发明涉及图像处理领域,具体涉及一种文本引导的零样本透明图层及分层图像生成方法,分层图像生成方法包括:输入全局图像文本提示、目标图像尺寸及层文本提示到前景位置信息生成模型,得到前景位置信息;为每个层文本提示生成第一目标图像;根据所有第一目标图像的透明通道,生成软分割掩码;叠加所有第一目标图像,并编码到潜在空间,得到前景叠加潜在特征;随机采样高斯噪声作为初始背景潜在特征。根据软分割掩码,在迭代式去噪过程中混合前景叠加潜在特征与初始背景潜在特征,得到全局图像潜在特征,并解码为第二目标图像。本发明对每个主体对象的位置进行精准控制,增强了模型的图像布局能力;免去了模型训练的步骤,极大节省计算资源。
技术关键词
图像生成方法 噪声 注意力 图像解码器 样本 图像编码器 分层 矩阵 尺寸 文本编码器 对象 代表 图像处理 通道 强度 网络
系统为您推荐了相关专利信息
局部放电检测方法 高压测试模块 耐压试验装置 程控变频电源 脉冲
医学超声图像 图像分类模型 标签 分类方法 分类器
实体 协同注意力 三元组 推荐方法 邻居
偏振图像去雾方法 透过率 损失函数优化 数据 卷积神经网络学习
水下机器人 协方差矩阵 卡尔曼滤波估计 导引方法 水声通信设备