一种基于泰老发音相似性的老挝语声学表征方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于泰老发音相似性的老挝语声学表征方法
申请号:CN202510786351
申请日期:2025-06-12
公开号:CN120636372A
公开日期:2025-09-12
类型:发明专利
摘要
本发明涉及一种基于泰老发音相似性的老挝语声学表征方法,属于自然语言处理技术领域。包括:对泰语、老挝语音频及文本数据进行统一预处理,构建泰语、老挝语词表;采用多语言自监督预训练模型,先用泰语训练集及泰语词表微调高层参数,冻结低层特征提取器,优化CTC损失,得到泰语微调后的模型;加载泰语微调后的模型,去除原泰语分类层,基于老挝语词表新建分类层并随机初始化,利用老挝语训练集进一步微调Transformer编码器及新分类层,优化CTC损失,得到适用于老挝语的声学表征模型;加载声学表征模型,在老挝语测试集上进行推理,计算CER,评估声学表征与识别性能。本发明显著提升了低资源语言老挝语的语音识别性能。
技术关键词
表征方法 发音 预训练模型 特征提取器 音频 多语言 数据一致性检查 编码器 检查点 训练集 文本 标签标准化 字符 表征系统 保存技术 热启动 自然语言 处理器 动态