多语义视频处理方法、装置、设备、介质和程序产品

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
多语义视频处理方法、装置、设备、介质和程序产品
申请号:CN202410825159
申请日期:2024-06-25
公开号:CN118379670B
公开日期:2024-12-10
类型:发明专利
摘要
本发明实施例提供一种多语义视频处理方法、装置、设备、介质和程序产品,该方法包括:先从空间角度进行特征提取,以得到待处理视频中视频帧各自的空间特征,再从时间角度进行特征提取,以得到视频帧各自的时空特征。进而,根据各视频帧的时空特征得到整个待处理视频的时空特征。最终,可以根据整个待处理视频的时空特征来对视频的语义进行分析,以定位出视频中的语义边界点,即语义发生变化的目标视频帧。其中,时空特征在反映视频帧中对象的空间信息、颜色信息以及对象的姿态变化信息等。因此,整个视频的时空特征可以更加完整、准确地反映对象在视频中的姿态变化,从而可以更细粒度的进行视频的语义分析,提高视频中语义边界点的定位准确性。
技术关键词
视频帧 空间特征提取 语义分析模型 采样率 非暂时性机器可读存储介质 特征提取网络 交叉注意力机制 校准 特征校验 解码网络 嵌入位置信息 解码器 序列 处理器 编辑 对象 计算机程序产品 蒸馏