一种主备双路音视频流的帧偏移量人工智能预测方法

申请号：CN202511042112

申请日期：2025-07-28

公开号：CN120894728A

公开日期：2025-11-04

类型：发明专利

摘要

本发明提供一种主备双路音视频流的帧偏移量人工智能预测方法，涉及视频处理技术领域。所述方法包括：对第一视频流和第二视频流进行预处理，获得第一视频帧序列和第二视频帧序列；对第一视频帧序列和第二视频帧序列分别进行特征提取处理，获得第一时空特征图和第二时空特征图；获取第一分区特征向量和第二分区特征向量，并输入时序关系模型，获得时序关系特征信息，并输入多层感知网络模型，获得帧偏移量。根据本发明，可通过对两个视频流进行相同的预处理，降低编码方式不同造成的影响，并且，可通过对视频帧的内容和时序关系进行理解的方式确定帧偏移量，进一步降低视频编码方式不同造成的视频帧差别的影响，提升对齐准确性。

技术关键词

视频帧多层感知网络视频流人工智能预测方法时序序列卷积神经网络模型交叉注意力机制层级关系人工智能预测系统计算机程序指令矩阵音视频视频编码方式融合特征键值特征提取模块分区模块

系统为您推荐了相关专利信息

一种医学超声图像数据集构建方法、系统和存储介质

数据集构建方法医学超声图像置信度阈值多模态表达式

面向宠物环境的多模式智能除菌除臭空气净化方法及系统

智能除菌空气净化方法传感器响应值设备控制指令采集宠物运动数据

基于多级智能评估的物联网数据质量筛选方法及系统

筛选方法样本筛选系统信号分析物联网数据处理

城市监控视角下基于去噪扩散模型的内涝检测方法与装置

时空分布图积水背景噪声干扰上下文特征监控视频图像

显示屏故障检测方法、系统、装置和存储介质

显示屏监控视频流故障检测模型故障检测方法校正