一种基于跨空间调节的文本驱动的风格迁移方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于跨空间调节的文本驱动的风格迁移方法
申请号:CN202411701484
申请日期:2024-11-26
公开号:CN119831826A
公开日期:2025-04-15
类型:发明专利
摘要
本发明公开了一种基于跨空间调节的文本驱动的风格迁移方法,包括:利用预训练的深度卷积神经网络VGG‑19从任意一张给定的照片中提取内容特征;利用预训练的CLIP文本编码器从任意一个给定的文本提示中提取风格特征;构造跨空间调节模块,用于弥合VGG特征空间和CLIP特征空间之间的差异;构造内容损失函数、定向CLIP损失函数、块对块CLIP损失函数以及基于CLIP的风格对比损失函数,用于约束风格迁移网络的生成过程,最终得到与目标内容和目标风格相符的艺术图像。本发明能够将文本中所描述的艺术风格迁移到日常照片上,创造出新的艺术图像,提升了艺术图像创意生成的灵活性和创新性,在文化创意、影视制作、工业设计等诸多领域有着重要的科学意义和应用价值。
技术关键词
风格迁移方法 文本编码器 代表 深度卷积神经网络 图像编码器 照片 样本 输入解码器 处理器 计算机程序产品 图像块 可读存储介质 模块 存储器 电子设备