一种自进化视频对象信息驱动目标分割框架构建方法

申请号：CN202410930630

申请日期：2024-07-11

公开号：CN118658103A

公开日期：2024-09-17

类型：发明专利

摘要

本发明公开了一种自进化视频对象信息驱动目标分割框架构建方法，首先提取视觉和语言特征，然后进行语言查询与动态核生成，接下来构建跨模态特征金字塔网络，最后进行实例序列分割处理。本发明通过整合先进的计算机视觉技术和自然语言处理技术，提供了一种从语言描述到视频对象分割的端到端解决方案，不仅提高了处理效率，还增强了分割精度，尤其适用于实时视频分析应用，如智能监控、交互式媒体编辑等。

技术关键词

框架构建方法视觉特征对象卷积神经网络提取特征金字塔网络交叉注意力机制动态交互式媒体多层级特征计算机视觉技术文本输入解码器实时视频编码器通道自然语言码头因子跨模态