音频数据的处理方法及装置

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
音频数据的处理方法及装置
申请号:CN202410755561
申请日期:2024-06-12
公开号:CN118522304A
公开日期:2024-08-20
类型:发明专利
摘要
本申请提供了一种音频数据的处理方法及装置,其中,该方法包括:从音频数据中提取初始音频特征,并对所述初始音频特征进行多尺度处理,其中,所述初始音频特征是不同的口型驱动任务共用的梅尔频谱特征;将所述初始音频特征分成多个时间窗口,并针对所述多个时间窗口中的每个时间窗口计算方差调制,得到方差调制特征;从口型驱动参考数据中提取空间相关性,采用非线性变换方法来从所述空间相关性中提取方差大于预设方差阈值的空间相关性特征,并将所述方差调制特征映射到与所述空间相关性特征相同的数值空间中,得到用于生成口型驱动数据的处理后的音频特征,其中,所述口型驱动参考数据是与预选的口型驱动任务对应的用于驱动口型的参考数据。
技术关键词
音频特征 非线性变换方法 调制特征 数据 融合特征 频谱特征 解码网络 虚拟对象 多尺度 数值 存储计算机程序 可读存储介质 电子设备 模块 存储器 处理器