面向供电服务电话系统的非自回归端到端的方言识别方法
申请号:CN202510918449
申请日期:2025-07-03
公开号:CN120748368A
公开日期:2025-10-03
类型:发明专利
摘要
本发明提供一种面向供电服务电话系统的非自回归端到端的方言识别方法,包括以下步骤:双声道电话录音语料预处理、自动预标注与上下文构建、人工标注及方言词库构建、子方言片区划分与分类建模、方言识别模型训练与优化。本发明基于ffmpeg音频处理工具提升了电话系统场景下语音数据处理的标准化与自动化水平,极大提高了人工标注效率。同时,针对方言种类繁多、差异显著等问题,构建统一的方言标注规则体系,结合迁移学习策略优化模型训练过程,在保证高准确率的同时增强模型在复杂电话语音环境中的鲁棒性与泛化能力。
技术关键词
方言识别方法
电话系统
音频
识别模型训练
双声道
文本
语音活动检测
语音特征
方言识别系统
电话录音数据
汉字
上下文语义信息
发音
声学特征
迁移学习策略
语义环境