基于文本反演的内容语义分离图像风格表征学习方法及装置
申请号:CN202411875145
申请日期:2024-12-19
公开号:CN119339090A
公开日期:2025-01-21
类型:发明专利
摘要
本发明公开了一种基于文本反演的内容语义分离图像风格表征学习方法及装置,属于图像风格迁移领域,实现将参考风格图像的内容语义信息从学习到的风格文本表示中分离的目标。所提出的方法分别对参考风格图像进行风格不变内容破坏数据增强和内容不变风格变换数据增强,通过对这两组数据增强后的图像以及参考风格图像进行基于文本反演的文本表示学习,以及构造相应的文本表示正则化损失,最终得到参考风格图像的内容语义无关风格文本表示,从而缓解内容泄露问题。
技术关键词
风格
表征学习方法
语义
反演方法
适配器
网络
光栅扫描顺序
交叉注意力机制
损失函数设计
数据
文本编码器
图像块
学习装置
计算机程序产品
处理器
噪声
可读存储介质