基于扩散模型和多模态大语言模型的遥感影像超分辨率方法及产品

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于扩散模型和多模态大语言模型的遥感影像超分辨率方法及产品
申请号:CN202510221647
申请日期:2025-02-27
公开号:CN119722462B
公开日期:2025-05-27
类型:发明专利
摘要
本申请提供了一种基于扩散模型和多模态大语言模型的遥感影像超分辨率方法,涉及图像处理技术领域。该方法采用了预训练的稳定扩散模型,该模型是在大规模数据集上训练的,能够实现稳定和详细的超分辨率效果,并具有更快的收敛速度。本申请还使用多模态大语言模型来增强模型的语义理解能力,提供详细的内容描述和纹理描述。本申请还引入了一个额外的分类器,它提供了关于LR的全局信息和简洁信号。这些先验信息通过交叉注意力模块自适应地集成到扩散模型中。最后,通过将稳定扩散模型强大的生成能力与MLLM的语义理解能力相结合,本申请提出的方法在重建遥感图像方面表现出色,在不同数据集上的多个图像质量方面实现了优异的性能。
技术关键词
超分辨率遥感影像 超分辨率方法 大语言模型 文本编码器 样本 分类器 低分辨率遥感图像 纹理 超分辨率装置 噪声 参数 子模块 图像编码 多模态 标签