一种音频特征生成方法、装置、设备及介质

申请号：CN202511245908

申请日期：2025-09-02

公开号：CN120977317A

公开日期：2025-11-18

类型：发明专利

摘要

本发明涉及音频技术领域，尤其涉及一种音频特征生成方法、装置、设备及介质。音频特征生成方法包括：选择目标音视频；对目标音视频中的原始音频进行语音识别得到文本字符串，并输入语音生成工具中得到生成音频；对原始音频和生成音频进行特征提取得到原始音频特征和生成音频特征；对原始音频特征和生成音频特征进行采样切分，得到N个原始音频特征向量和K个生成音频特征向量；之后获取相似距离矩阵M；在相似距离矩阵M中采用Dijkstra算法规划最佳路径；基于最佳路径确定目标生成音频特征向量，将目标生成音频特征向量作为音频特征训练数据并输出。本发明技术方案，可大大提高了训练速度和模型的实际生成效果。

技术关键词

音频特征生成方法音视频 Dijkstra算法音唇同步音频特征提取生成工具特征提取模块语音矩阵文本识别工具规划数据生成装置输出模块程序指令