摘要
本发明涉及音频技术领域,具体提供一种基于自然语言提示的音乐生成方法,包括以下步骤:S1.从前端/移动端文本框获得用户输入自然语言提示词,发送到后端进行处理;S2.通过基于Transformer编码器将其嵌入为高维向量;S3.初始化音乐为<songstart>标记,作为音乐生成的起始点;S4.循环处理音乐生成;S5.将音乐以abc谱或midi形式返回到前端。通过树形网络编码器和多头注意力机制,提高了音乐生成的速度和质量,采用节奏旋转位置编码(BRoPE)和多层绝对位置编码。使模型能够更好地处理音乐节奏和结构。