一种基于大模型的视频融合方法及系统

申请号：CN202511058928

申请日期：2025-07-30

公开号：CN120568159A

公开日期：2025-08-29

类型：发明专利

摘要

本发明涉及视频处理技术领域，具体涉及一种基于大模型的视频融合方法及系统；方法包括：获取视频流进行画面分割，针对每个分割画面识别运动目标，预测运动目标轨迹，并匹配最小像素区域，确定关键帧；提取特征，聚焦关键区域中的识别目标；生成静态场景，对齐识别目标及场景，获取动态遮挡关系，输出融合视频数据；系统包括：动态画面划分模块、多模态特征提取模块、动态融合重建模块；通过针对每个分割画面识别运动目标，预测运动目标轨迹，匹配最小像素区域，确定关键帧，并聚焦关键区域中的识别目标，对齐识别目标及场景，获取动态遮挡关系，输出融合视频数据；实现了处理运动目标的轨迹变化，避免融合结果出现重影及错位。

技术关键词

视频融合方法视觉特征遮挡关系画面关键帧特征提取模块文本时序实时视频流运动场景动态视频融合系统主成分分析降维色彩校正轨迹多模态直方图均衡化

系统为您推荐了相关专利信息

一种多分支辅助融合改进YOLOv10无人机水面物体目标检测方法

多分支水面漂浮物标注工具数据物体

一种基于虚拟引擎的鱼眼相机模型构建方法及系统

鱼眼相机相机模型模型构建方法网格面片

一种基于拓展现实的UI风格化方法及装置

视觉特征提取元素场景文本大语言模型

基于结构语义提示约束的文本图像生成方法

图像生成方法文本语义场景模态特征样本

一种基于深度学习的会议大屏音视频自优化方法和系统

音视频分布式麦克风阵列 PID控制器人脸关键点参数