摘要
本申请涉及图像处理领域,公开了基于遥感篡改图像的视觉问答方法、系统、设备及介质,包括:通过主分支网络对篡改图像进行视觉特征提取,边缘先验引导块对各层编码器的输入特征进行特征提取;通过先验分支对图像进行边缘检测获得边缘先验特征,边缘先验特征与每个边缘先验引导块中的输入特征融合后输出,作为下一个边缘先验引导块的输入特征进行视觉特征提取;通过边缘先验特征引导,对输入文本进行特征提取,将提取的视觉特征和文本特征跨模态融合;根据融合后的特征,进行多模态推理,输出问答结果;本申请通过引入先验分支以给主分支提供边缘先验特征,显著恢复并加强了复制‑移动篡改图像的边缘伪影,提高篡改图像分析和理解准确性。