一种自进化视频对象信息驱动目标分割框架构建方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种自进化视频对象信息驱动目标分割框架构建方法
申请号:CN202410930630
申请日期:2024-07-11
公开号:CN118658103A
公开日期:2024-09-17
类型:发明专利
摘要
本发明公开了一种自进化视频对象信息驱动目标分割框架构建方法,首先提取视觉和语言特征,然后进行语言查询与动态核生成,接下来构建跨模态特征金字塔网络,最后进行实例序列分割处理。本发明通过整合先进的计算机视觉技术和自然语言处理技术,提供了一种从语言描述到视频对象分割的端到端解决方案,不仅提高了处理效率,还增强了分割精度,尤其适用于实时视频分析应用,如智能监控、交互式媒体编辑等。
技术关键词
框架构建方法 视觉特征 对象 卷积神经网络提取 特征金字塔网络 交叉注意力机制 动态 交互式媒体 多层级特征 计算机视觉技术 文本 输入解码器 实时视频 编码器 通道 自然语言 码头 因子 跨模态