使用机器学习模型进行语音音频校正
# 热门搜索 #
大模型
人工智能
openai
融资
chatGPT
AITNT公众号
AITNT APP
AITNT交流群
搜索
首页
AI资讯
AI技术研报
AI监管政策
AI产品测评
AI商业项目
AI产品热榜
AI专利库
寻求报道
使用机器学习模型进行语音音频校正
申请号:
CN202510197695
申请日期:
2025-02-21
公开号:
CN120544533A
公开日期:
2025-08-26
类型:
发明专利
摘要
本发明公开了使用机器学习模型进行语音音频校正,具体公开了使用机器学习模型来校正语音音频的系统和技术。该技术包括:将输入音频的第一转录与输入音频的第二转录进行比较,以识别修改后的词集,其中第二转录是第一转录的修改后的版本。该技术包括:基于修改后的词集使用文本转语音机器学习模型来生成合成音频,以及基于合成音频和输入音频的至少一部分使用话音匹配机器学习模型来生成修改后的合成音频。该技术包括:通过组合输入音频与修改后的合成音频来生成输出音频。
技术关键词
机器学习模型
音频
自动语音识别
有声读物
车载信息娱乐系统
噪声
虚拟现实内容
电路系统
自然语言
掩模
文本
协作内容
大语言模型
处理器
数字孪生
校正
数据中心
视频
机器人
系统为您推荐了相关专利信息
1
一种基于区块链技术的网络信息安全预警方法及系统
信息安全预警方法
区块链技术
数据
指数加权移动平均值
机器学习模型
2
一种基于血清拉曼光谱作为生物标志物在认知障碍诊断中的应用方法
诊断模块
血清
集成学习模型
机器学习模型
样本
3
基于数字化交付的工程建设全生命周期管理平台及方法
施工现场
全生命周期管理
特征工程技术
激光扫描仪
机器学习模型
4
一种螺栓斜面安装承载性能预测方法及装置
性能预测方法
机器学习模型
性能预测模型
斜面角度
数据
5
一种大语言模型训练加速方法
大语言模型
参数
优化器
加速训练方法
内存