一种视频识别方法、设备、介质及视频识别模型训练装置
申请号:CN202511117390
申请日期:2025-08-11
公开号:CN120783269A
公开日期:2025-10-14
类型:发明专利
摘要
一种视频识别方法、设备、介质及视频识别模型训练装置,其视频识别方法包括:构建包含多种切换类型的视频场景切换识别训练集;对视频场景切换识别训练集进行采样,得到训练视频序列;对训练视频序列进行时序特征提取与融合编码,得到融合特征图;基于融合特征图进行分类处理,得到视频场景切换识别预测结果;通过优化损失函数进行模型训练,直至损失收敛,得到视频识别模型;将待识别视频输入视频识别模型,得到视频场景切换识别结果。本发明能够提高视频场景切换识别的准确性,满足移动端部署的实时性与精确度要求。
技术关键词
视频识别方法
融合特征
模型训练装置
场景
训练集
序列
sigmoid函数
训练特征融合
软切换
多标签
滑动窗口
时序
可读存储介质
编码
处理器
标记
采样模块