一种面向语音内容为中心的自监督对比表示学习方法、系统、电子设备、可读存储介质
申请号:CN202510108344
申请日期:2025-01-23
公开号:CN119943033B
公开日期:2025-10-14
类型:发明专利
摘要
本发明涉及一种面向语音内容为中心的自监督对比表示学习方法、系统、电子设备、可读存储介质,属于语音识别领域。本发明包括步骤:获取多任务语音识别相关的数据集;多任务语音识别相关的数据集预处理;利用音调扰动和说话人扰动的语音数据进行训练预训练语言模型,并通过微调预训练语言模型最后两层实现对语音表征的优化;提取扰动语音的表征后,通过Sinkhorn‑Knopp算法对表征矩阵进行归一化;通过设计对比损失函数,优化表征的语义一致性并提升预训练语言模型对内容的聚合能力。本发明通过利用自监督微调预训练模型,有效的解决了语音内容表征和说话人表征解耦问题,提升了模型在内容相关的识别任务上的性能。
技术关键词
预训练语言模型
学习方法
多任务
算法
自动语音识别
说话人识别
矩阵
电子设备
可读存储介质
预训练模型
学习系统
数据
音频特征
处理器
语音特征
语义
代表