一种音频特征生成方法、装置、设备及介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种音频特征生成方法、装置、设备及介质
申请号:CN202511245908
申请日期:2025-09-02
公开号:CN120977317A
公开日期:2025-11-18
类型:发明专利
摘要
本发明涉及音频技术领域,尤其涉及一种音频特征生成方法、装置、设备及介质。音频特征生成方法包括:选择目标音视频;对目标音视频中的原始音频进行语音识别得到文本字符串,并输入语音生成工具中得到生成音频;对原始音频和生成音频进行特征提取得到原始音频特征和生成音频特征;对原始音频特征和生成音频特征进行采样切分,得到N个原始音频特征向量和K个生成音频特征向量;之后获取相似距离矩阵M;在相似距离矩阵M中采用Dijkstra算法规划最佳路径;基于最佳路径确定目标生成音频特征向量,将目标生成音频特征向量作为音频特征训练数据并输出。本发明技术方案,可大大提高了训练速度和模型的实际生成效果。
技术关键词
音频特征生成方法 音视频 Dijkstra算法 音唇同步 音频特征提取 生成工具 特征提取模块 语音 矩阵 文本 识别工具 规划 数据 生成装置 输出模块 程序 指令