基于不确定性估计的多模态状态空间集成的图像分割方法
申请号:CN202411847031
申请日期:2024-12-16
公开号:CN119624982B
公开日期:2025-08-19
类型:发明专利
摘要
本发明公开了一种基于不确定性估计的多模态状态空间集成的图像分割方法,该方法包括:获取图像数据和图像数据对应的文本数据;利用CLV‑SSIF模型,根据图像数据和文本数据,对图像进行分割,其中,CLV‑SSIF模型包含多模态空间集成组件和多专家不确定性优化组件,多模态空间集成组件包括图像编码器、文本编码器以及多模态交互式引导解码器;多专家不确定性优化组件用于利用多专家混合模型,生成对图像的初始分割结果并生成专家不确定估计,然后根据专家不确定估计,对初始分割结果进行优化。本发明的方法提升了图像分割的准确度。
技术关键词
图像分割方法
图像编码器
集成组件
多模态特征
掩膜
文本编码器
多模态交互
解码器
模块
生成图像特征
交叉注意力机制
数据
上采样
适配器