一种针对小语种的语音识别算法

申请号：CN202510679193

申请日期：2025-05-26

公开号：CN120526756A

公开日期：2025-08-22

类型：发明专利

摘要

本发明涉及语音识别技术领域，公开了一种针对小语种的语音识别算法，包括：S1：构建多语种关键词平行语料库；S2：通过对多语种关键词平行语料库进行分析，获得各其他语种与目标小语种的关键词发音相似指数，并筛选出若干个第一参考语种；S3：构建综合平行语料库；S4：将综合平行语料库的语料信息划分为若干个语料分析单元；S5：筛选出目标语料分析单元；S6：根据综合平行语料库的语料信息数据筛选出各目标语料分析单元的目标迁移语种；S7：根据各目标语料分析单元的目标迁移语种进行跨语种迁移建模；实现了从海量语种中精准定位最优迁移源的目标；有效解决了目标小语种因数据稀缺而导致的模型训练困难问题。

技术关键词

平行语料库语音识别算法关键词分析单元发音指数波形语音识别技术数据词语音频图像特征点轨迹标记

系统为您推荐了相关专利信息

具有前向安全的后量子认证可搜索加密方法及系统

可搜索加密方法云服务器关键字接收方可信机构

一种自然语言威胁情报抽取分析方法及系统

网络安全数据时间段滑动窗口算法关键词机器学习模型

用于金融应用系统的非功能治理系统及方法

大语言模型金融图谱指标关键词数据

一种全数字化实验室温度智能监测装置

温度智能监测装置智能数据处理传感器模块智能控制模块数据存储管理

基于多模态信息融合的视频处理方法、装置、设备及介质

语音识别文本多模态信息融合图像特征识别算法视频关键帧提取算法