一种基于大模型的视频融合方法及系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于大模型的视频融合方法及系统
申请号:CN202511058928
申请日期:2025-07-30
公开号:CN120568159A
公开日期:2025-08-29
类型:发明专利
摘要
本发明涉及视频处理技术领域,具体涉及一种基于大模型的视频融合方法及系统;方法包括:获取视频流进行画面分割,针对每个分割画面识别运动目标,预测运动目标轨迹,并匹配最小像素区域,确定关键帧;提取特征,聚焦关键区域中的识别目标;生成静态场景,对齐识别目标及场景,获取动态遮挡关系,输出融合视频数据;系统包括:动态画面划分模块、多模态特征提取模块、动态融合重建模块;通过针对每个分割画面识别运动目标,预测运动目标轨迹,匹配最小像素区域,确定关键帧,并聚焦关键区域中的识别目标,对齐识别目标及场景,获取动态遮挡关系,输出融合视频数据;实现了处理运动目标的轨迹变化,避免融合结果出现重影及错位。
技术关键词
视频融合方法 视觉特征 遮挡关系 画面 关键帧 特征提取模块 文本 时序 实时视频流 运动 场景 动态 视频融合系统 主成分分析降维 色彩校正 轨迹 多模态 直方图均衡化
系统为您推荐了相关专利信息
多分支 水面漂浮物 标注工具 数据 物体
鱼眼相机 相机模型 模型构建方法 网格 面片
视觉特征提取 元素 场景 文本 大语言模型
图像生成方法 文本 语义场景 模态特征 样本
音视频 分布式麦克风阵列 PID控制器 人脸关键点 参数