一种基于深度学习的会议大屏音视频自优化方法和系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于深度学习的会议大屏音视频自优化方法和系统
申请号:CN202510497430
申请日期:2025-04-21
公开号:CN120358387A
公开日期:2025-07-22
类型:发明专利
摘要
本发明公开了一种基于深度学习的会议大屏音视频自优化方法及系统,属于智能音视频处理技术领域。针对现有技术中实时性不足、跨模态协同弱及动态场景适应性差等问题,提出分域多模态参数采集与层次化融合的创新架构。方法包括:通过分时采样机制差异化采集声学参数(背景噪声频谱、声源方向角)和视频参数(光照动态范围、人脸关键点位移);利用频域掩码生成噪声抑制权重矩阵及光流法提取画面稳定性特征。实验表明,本方案在55dB噪声环境下语音信噪比提升至22.5dB,弱网场景音视频同步误差降至18ms,动态光照过曝恢复帧数减少62.5%,显著优于传统方案,为混合办公场景提供高鲁棒性、低延迟的音视频自优化解决方案。
技术关键词
音视频 分布式麦克风阵列 PID控制器 人脸关键点 参数 强化学习代理 深度学习模型 声画同步 低延迟数据处理 多模态 背景噪声 动态 输入噪声抑制 存储优化策略 生成噪声 跨模态 画面 模块 会议
系统为您推荐了相关专利信息
资源 数据处理方法 计算机执行指令 算法 可读存储介质
非连续变形分析方法 露天转地下开采 岩体结构面 裂隙网络模型 地质力学模型
热空气 增效肥料 时序特征 抗盐 序列
无线传能系统 功率提升方法 铝合金板 接收线圈 高频逆变器
成本核算方法 数据 可读存储介质 生成提示信息 计算机设备