基于大语言模型与思维链强化学习的歌词生成方法及系统
申请号:CN202510518496
申请日期:2025-04-24
公开号:CN120430289A
公开日期:2025-08-05
类型:发明专利
摘要
本发明涉及一种基于大语言模型与思维链强化学习的歌词生成方法及系统。所述方法包括:为歌词创作示例数据设计思维链路径,对大语言模型进行参数调整;通过调整后的大语言模型对每个段落进行多轮推理,得到各个思考路径;基于过程奖励模型对各个思考路径进行评分;使用蒙特卡洛树搜索算法挑选出得分最高的思考路径作为正样本,通过束搜索算法选定其他路径作为负样本,训练出歌词生成模型。通过设计思维链路径进行模型微调,可以增强模型生成歌词思考路径的能力;通过大语言模型对每个段落进行多轮推理,产生多种不同的思考路径,可以增强歌词生成的个性化、逻辑性和情感表达,从而提供更加贴近实际需求的音乐创作文本。
技术关键词
歌词生成方法
大语言模型
搜索算法
样本
数据
蒙特卡洛树搜索
生成系统
生成歌词
节点
模型训练模块
传播算法
参数
语义
关键词
风格
主题
文本
编码