一种面向语音内容为中心的自监督对比表示学习方法、系统、电子设备、可读存储介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种面向语音内容为中心的自监督对比表示学习方法、系统、电子设备、可读存储介质
申请号:CN202510108344
申请日期:2025-01-23
公开号:CN119943033B
公开日期:2025-10-14
类型:发明专利
摘要
本发明涉及一种面向语音内容为中心的自监督对比表示学习方法、系统、电子设备、可读存储介质,属于语音识别领域。本发明包括步骤:获取多任务语音识别相关的数据集;多任务语音识别相关的数据集预处理;利用音调扰动和说话人扰动的语音数据进行训练预训练语言模型,并通过微调预训练语言模型最后两层实现对语音表征的优化;提取扰动语音的表征后,通过Sinkhorn‑Knopp算法对表征矩阵进行归一化;通过设计对比损失函数,优化表征的语义一致性并提升预训练语言模型对内容的聚合能力。本发明通过利用自监督微调预训练模型,有效的解决了语音内容表征和说话人表征解耦问题,提升了模型在内容相关的识别任务上的性能。
技术关键词
预训练语言模型 学习方法 多任务 算法 自动语音识别 说话人识别 矩阵 电子设备 可读存储介质 预训练模型 学习系统 数据 音频特征 处理器 语音特征 语义 代表