语音识别模型的训练方法、服务器和计算机可读存储介质
申请号:CN202510253088
申请日期:2025-03-04
公开号:CN120164458A
公开日期:2025-06-17
类型:发明专利
摘要
本申请公开了一种语音识别模型的训练方法、服务器和计算机可读存储介质。方法包括:根据获取到的目标训练数据,确定与目标训练数据相关联的目标时间戳信息,其中,目标训练数据包括目标音频数据和与目标音频数据相对应的目标文本数据。接着,根据目标训练数据和目标时间戳信息,确定目标掩码训练数据。最后,根据目标掩码训练数据对语音识别模型进行训练。如此,通过时间戳驱动的协同掩码技术,在语音识别模型训练阶段主动对目标训练数据进行处理,确定目标掩码训练数据,能够使语音识别模型学习深层次的上下文语义及抗干扰特征,降低误触率,提升用户体验。
技术关键词
语音识别模型
关键词
数据
音频
文本
抗干扰特征
可读存储介质
服务器
掩码技术
计算机
处理器
存储器
语义
噪声
阶段
程序