一种主备双路音视频流的帧偏移量人工智能预测方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种主备双路音视频流的帧偏移量人工智能预测方法
申请号:CN202511042112
申请日期:2025-07-28
公开号:CN120894728A
公开日期:2025-11-04
类型:发明专利
摘要
本发明提供一种主备双路音视频流的帧偏移量人工智能预测方法,涉及视频处理技术领域。所述方法包括:对第一视频流和第二视频流进行预处理,获得第一视频帧序列和第二视频帧序列;对第一视频帧序列和第二视频帧序列分别进行特征提取处理,获得第一时空特征图和第二时空特征图;获取第一分区特征向量和第二分区特征向量,并输入时序关系模型,获得时序关系特征信息,并输入多层感知网络模型,获得帧偏移量。根据本发明,可通过对两个视频流进行相同的预处理,降低编码方式不同造成的影响,并且,可通过对视频帧的内容和时序关系进行理解的方式确定帧偏移量,进一步降低视频编码方式不同造成的视频帧差别的影响,提升对齐准确性。
技术关键词
视频帧 多层感知网络 视频流 人工智能预测方法 时序 序列 卷积神经网络模型 交叉注意力机制 层级 关系 人工智能预测系统 计算机程序指令 矩阵 音视频 视频编码方式 融合特征 键值 特征提取模块 分区模块
系统为您推荐了相关专利信息
数据集构建方法 医学超声图像 置信度阈值 多模态 表达式
智能除菌 空气净化方法 传感器响应值 设备控制指令 采集宠物运动数据
筛选方法 样本 筛选系统 信号分析 物联网数据处理
时空分布图 积水 背景噪声干扰 上下文特征 监控视频图像
显示屏 监控视频流 故障检测模型 故障检测方法 校正