基于双录场景的违规行为检测方法、装置及计算机设备

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于双录场景的违规行为检测方法、装置及计算机设备
申请号:CN202411029321
申请日期:2024-07-29
公开号:CN118965069A
公开日期:2024-11-15
类型:发明专利
摘要
本申请实施例属于人工智能领域,涉及一种基于双录场景的违规行为检测方法,包括:获取待检测的音视频;将音视频输入双录违规检测模型中的多模态特征提取网络,以提取音视频的多模态特征,多模态特征包括音视频的视频特征和音频特征;将多模态特征输入双录违规检测模型中的音频分离网络,得到音视频中各说话人的音频;基于各说话人的音频,通过多模态特征提取网络在各说话人中确定关键说话人,并确定关键说话人的音频;将多模态特征和关键说话人的音频输入双录违规检测模型中的违规检测网络,以进行旁人指导违规检测,得到音视频的违规检测结果。本申请解决了双录场景中旁人指导违规行为检测准确性较低的问题。
技术关键词
违规检测模型 多模态特征 音视频 特征提取网络 音频特征 计算机可读指令 场景 声纹特征 编码特征 计算机设备 同步性 可读存储介质 发声 特征提取模块 样本
系统为您推荐了相关专利信息
细胞分割方法 局部图像特征 文本 高维特征向量 图像块
文本匹配方法 滑动窗口 增强子 语义 降噪单元
特征提取网络 细胞分类方法 嵌入特征 样本 宫颈
软件定义网络 互联系统 音视频 协议 数据
数字医学健康参数监测装置 脉象数据 眼动数据 模型库 多算法融合模型