多模态协同的视频序列分割方法

申请号：CN202511023402

申请日期：2025-07-24

公开号：CN120932151A

公开日期：2025-11-11

类型：发明专利

摘要

本发明公开了一种多模态协同的视频序列分割方法，步骤包括：获得图像序列的多尺度局部特征矩阵以及多尺度全局特征矩阵；获得文本序列的多尺度文本特征矩阵；获得多尺度局部特征矩阵以及多尺度全局特征矩阵的多尺度局部‑全局融合特征矩阵；获得多尺度局部‑全局融合特征矩阵以及多尺度文本特征矩阵的多模态融合特征矩阵；利用预训练大模型的解码器来预测生成分割掩码，输出语义分割图。该视频序列分割方法在面对复杂多变的场景时表现稳定，无需依赖大量标注数据，降低了训练成本，适用于多种实际应用领域，包括智能监控、自动驾驶及医学影像分析等。

技术关键词

视频序列分割方法融合特征融合专家多尺度局部特征矩阵多模态协同全局特征提取语义特征提取局部特征提取时序深度卷积神经网络图像文本编码器混合专家网络解码器分支

系统为您推荐了相关专利信息

一种基于大语言模型的智能医学报告单解读方法

医学报告单大语言模型解读方法自然语言患者

基于可拓云模型考虑应急场景下的储能选址方法及装置

可拓云模型储能选址方法评估指标体系节点储能需求

一种多模态病理数据融合分析系统

融合特征多任务生成特征分析系统模态特征

一种基于时空双压缩机制的轻量级长短时交通流预测方法

交通流预测方法注意力模型节点特征复杂度传感器节点

健康状态评估方法、系统及电子设备

健康状态评估方法深度信念网络指标聚类矩阵