一种基于深度学习的会议大屏音视频自优化方法和系统

申请号：CN202510497430

申请日期：2025-04-21

公开号：CN120358387A

公开日期：2025-07-22

类型：发明专利

摘要

本发明公开了一种基于深度学习的会议大屏音视频自优化方法及系统，属于智能音视频处理技术领域。针对现有技术中实时性不足、跨模态协同弱及动态场景适应性差等问题，提出分域多模态参数采集与层次化融合的创新架构。方法包括：通过分时采样机制差异化采集声学参数(背景噪声频谱、声源方向角)和视频参数(光照动态范围、人脸关键点位移)；利用频域掩码生成噪声抑制权重矩阵及光流法提取画面稳定性特征。实验表明，本方案在55dB噪声环境下语音信噪比提升至22.5dB，弱网场景音视频同步误差降至18ms，动态光照过曝恢复帧数减少62.5％，显著优于传统方案，为混合办公场景提供高鲁棒性、低延迟的音视频自优化解决方案。

技术关键词

音视频分布式麦克风阵列 PID控制器人脸关键点参数强化学习代理深度学习模型声画同步低延迟数据处理多模态背景噪声动态输入噪声抑制存储优化策略生成噪声跨模态画面模块会议

系统为您推荐了相关专利信息

数据处理方法、装置、设备、计算机可读存储介质及产品

资源数据处理方法计算机执行指令算法可读存储介质

露天转地下崩落法开采诱发滑塌冲击的地采安全评价方法

非连续变形分析方法露天转地下开采岩体结构面裂隙网络模型地质力学模型

一种抗盐增效肥料及其制备方法

热空气增效肥料时序特征抗盐序列

一种用于GIS内部传感器无线传能系统及功率提升方法

无线传能系统功率提升方法铝合金板接收线圈高频逆变器