使用机器学习模型进行语音音频校正

申请号：CN202510197695

申请日期：2025-02-21

公开号：CN120544533A

公开日期：2025-08-26

类型：发明专利

摘要

本发明公开了使用机器学习模型进行语音音频校正，具体公开了使用机器学习模型来校正语音音频的系统和技术。该技术包括：将输入音频的第一转录与输入音频的第二转录进行比较，以识别修改后的词集，其中第二转录是第一转录的修改后的版本。该技术包括：基于修改后的词集使用文本转语音机器学习模型来生成合成音频，以及基于合成音频和输入音频的至少一部分使用话音匹配机器学习模型来生成修改后的合成音频。该技术包括：通过组合输入音频与修改后的合成音频来生成输出音频。

技术关键词

机器学习模型音频自动语音识别有声读物车载信息娱乐系统噪声虚拟现实内容电路系统自然语言掩模文本协作内容大语言模型处理器数字孪生校正数据中心视频机器人

系统为您推荐了相关专利信息

一种基于区块链技术的网络信息安全预警方法及系统

信息安全预警方法区块链技术数据指数加权移动平均值机器学习模型

一种基于血清拉曼光谱作为生物标志物在认知障碍诊断中的应用方法

诊断模块血清集成学习模型机器学习模型样本

基于数字化交付的工程建设全生命周期管理平台及方法

施工现场全生命周期管理特征工程技术激光扫描仪机器学习模型

一种螺栓斜面安装承载性能预测方法及装置

性能预测方法机器学习模型性能预测模型斜面角度数据

一种大语言模型训练加速方法

大语言模型参数优化器加速训练方法内存