目标跨模态表达辅助的遥感场景文本-图像生成方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
目标跨模态表达辅助的遥感场景文本-图像生成方法
申请号:CN202411070980
申请日期:2024-08-06
公开号:CN118587327B
公开日期:2024-10-01
类型:发明专利
摘要
本发明属于图像信息处理技术领域,公开了一种目标跨模态表达辅助的遥感场景文本‑图像生成方法。本方法先利用预训练图像文本联合表达模型的跨模态特征关联能力,为目标图像条件自适应地匹配对应的文本模态表达,通过目标图像到目标文本的跨模态转化避免布局的不确定性对目标信息引入产生的干扰;再将目标文本特征与原文本条件特征进行集成,利用目标信息对文本条件进行修饰与扩充;最后经补充的文本特征作为控制条件引入图像生成流程,对生成图像进行调控。本发明在避免额外布局先验引入的同时,有效实现利用图像目标条件对生成图像中目标局部的针对性增强。
技术关键词
图像编码器 文本编码器 跨模态 图像生成方法 模态特征 视觉特征 缩放参数 图像信息处理技术 数据分布 图像生成网络 图像数据集合 表征场景 通道 阶段 多层感知机 噪声
系统为您推荐了相关专利信息
模态特征 样本 跨模态检索方法 预训练语言模型 损失函数优化
通信信道 仿真软件 多层感知器 环境感知数据 仿真平台
图像生成方法 文本 图像生成装置 处理单元 控件
客户端 蒸馏 分类系统 模态特征 计算方法
数据挖掘方法 多模态 数据挖掘设备 数据挖掘装置 场景