摘要
本发明涉及人工智能技术领域,可应用于金融科技、医疗健康等业务系统平台中,揭露了一种自监督音乐表征提取方法、装置、设备及介质,所述方法包括:对第一梅尔频谱进行残差矢量量化,得到若干离散令牌,利用离散令牌重建过程中的组合目标损失函数对初始分词器进行优化,得到目标分词器,对音乐数据集的第二梅尔频谱进行分词,得到若干目标令牌序列,对随机遮蔽后的第二梅尔频谱进行多头自注意力与卷积处理,得到遮蔽位置对应的预测令牌序列,并确定与目标令牌序列之间的交叉熵损失,对表征学习模型进行优化,得到目标音乐表征学习模型,并提取音乐数据集的音乐向量表征。本发明提高了音乐表征的提取效率与可靠性。