一种多英语口音的语音识别方法及系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种多英语口音的语音识别方法及系统
申请号:CN202410819623
申请日期:2024-06-24
公开号:CN118782092A
公开日期:2024-10-15
类型:发明专利
摘要
本发明公开一种多英语口音的语音识别方法及系统,属于口音识别领域。针对现有英语口音识别精度差且成本高的问题,本发明提供一种多英语口音的语音识别方法,包括采集音频数据;对音频数据进行特征提取,并根据特征计算该音频数据的特征向量值;根据特征向量值判断该音频数据所属的口音类别;根据音频数据所属的口音类别选择对应的预训练模型对音频数据进行语音识别。本发明根据音频的特征向量值确定音频数据所属的口音类别,避免直接根据音频说话人所属地域来划分口音类别所造成的误差;避免使用一种通用模型所带来的识别不准确的问题;整个识别方法实现了便携式低资源计算的英语口音识别,在混合多种英语口音的应用场景下,有效提高识别率。
技术关键词
语音识别方法 特征向量值 英语 音频 训练识别模型 语音采集模块 语音识别系统 麦克风阵列 信号处理模块 数据存储模块 识别模块 解码 场景 误差 资源 精度