一种面向语音内容为中心的自监督对比表示学习方法、系统、电子设备、可读存储介质

申请号：CN202510108344

申请日期：2025-01-23

公开号：CN119943033B

公开日期：2025-10-14

类型：发明专利

摘要

本发明涉及一种面向语音内容为中心的自监督对比表示学习方法、系统、电子设备、可读存储介质，属于语音识别领域。本发明包括步骤：获取多任务语音识别相关的数据集；多任务语音识别相关的数据集预处理；利用音调扰动和说话人扰动的语音数据进行训练预训练语言模型，并通过微调预训练语言模型最后两层实现对语音表征的优化；提取扰动语音的表征后，通过Sinkhorn‑Knopp算法对表征矩阵进行归一化；通过设计对比损失函数，优化表征的语义一致性并提升预训练语言模型对内容的聚合能力。本发明通过利用自监督微调预训练模型，有效的解决了语音内容表征和说话人表征解耦问题，提升了模型在内容相关的识别任务上的性能。

技术关键词

预训练语言模型学习方法多任务算法自动语音识别说话人识别矩阵电子设备可读存储介质预训练模型学习系统数据音频特征处理器语音特征语义代表