使用机器学习模型进行语音音频校正

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
使用机器学习模型进行语音音频校正
申请号:CN202510197695
申请日期:2025-02-21
公开号:CN120544533A
公开日期:2025-08-26
类型:发明专利
摘要
本发明公开了使用机器学习模型进行语音音频校正,具体公开了使用机器学习模型来校正语音音频的系统和技术。该技术包括:将输入音频的第一转录与输入音频的第二转录进行比较,以识别修改后的词集,其中第二转录是第一转录的修改后的版本。该技术包括:基于修改后的词集使用文本转语音机器学习模型来生成合成音频,以及基于合成音频和输入音频的至少一部分使用话音匹配机器学习模型来生成修改后的合成音频。该技术包括:通过组合输入音频与修改后的合成音频来生成输出音频。
技术关键词
机器学习模型 音频 自动语音识别 有声读物 车载信息娱乐系统 噪声 虚拟现实内容 电路系统 自然语言 掩模 文本 协作内容 大语言模型 处理器 数字孪生 校正 数据中心 视频 机器人
系统为您推荐了相关专利信息
信息安全预警方法 区块链技术 数据 指数加权移动平均值 机器学习模型
诊断模块 血清 集成学习模型 机器学习模型 样本
施工现场 全生命周期管理 特征工程技术 激光扫描仪 机器学习模型
性能预测方法 机器学习模型 性能预测模型 斜面角度 数据
大语言模型 参数 优化器 加速训练方法 内存