自监督音乐表征提取方法、装置、设备及介质

申请号：CN202511052026

申请日期：2025-07-29

公开号：CN120808813A

公开日期：2025-10-17

类型：发明专利

摘要

本发明涉及人工智能技术领域，可应用于金融科技、医疗健康等业务系统平台中，揭露了一种自监督音乐表征提取方法、装置、设备及介质，所述方法包括：对第一梅尔频谱进行残差矢量量化，得到若干离散令牌，利用离散令牌重建过程中的组合目标损失函数对初始分词器进行优化，得到目标分词器，对音乐数据集的第二梅尔频谱进行分词，得到若干目标令牌序列，对随机遮蔽后的第二梅尔频谱进行多头自注意力与卷积处理，得到遮蔽位置对应的预测令牌序列，并确定与目标令牌序列之间的交叉熵损失，对表征学习模型进行优化，得到目标音乐表征学习模型，并提取音乐数据集的音乐向量表征。本发明提高了音乐表征的提取效率与可靠性。

技术关键词

音乐令牌矢量量化频谱特征序列更新模型参数声学特征分词注意力短时傅里叶变换数据遮蔽模块语义人工智能技术医疗健康索引电子设备处理器通信业务系统