如今,AI 神曲传播的速度已经远远超出了我们的想象。
在 B 站,有这样一位音乐 UP 主「漫游会议室」,他将《西游记》中的经典人物「请进」录音棚,利用 AI 来填词、作曲。在三个多月时间里,创作出了 30 个作品,大部分都是百万播放量,其中爆火的美猴「亡」更是超过了 1600 万。
一个个为人熟知的荧幕形象,在 AI 的指挥下声情并茂地倾诉自身遭遇,成为了音乐区一个特殊的存在。

图源:B 站 UP 主「漫游会议室」
当然,AI 音乐并不是要取代人类创作者,反而更有可能帮助他们的作品出圈。这个月,FYI.AI 创始人、美国音乐团体 Black Eyed Peas 成员 Will.i.am 在接受采访时表示,「AI 正在为创作者带来一场新的文艺复兴。」AI 的加入使得音乐创作变成了一种人机协作的融合形态。
1 月 28 日,国内 AI 音乐界扛把子昆仑天工,面向全球用户发布了最新音乐大模型 Mureka V8。

昆仑万维董事长兼 CEO 方汉
新模型在继续降低创作门槛、推动「人人都能成为创作者」的同时,旗帜鲜明地亮出了 AI 音乐进化为一种新音乐品类的概念。
今晚 8 点,由 Mureka 包揽词曲与编曲的 M:RA 女团主打歌曲《MCE》已经在 QQ 正式上线。同时与太和音乐联合发行了这首歌的 MV,气场十足,感觉一下子就将我们拉进了打歌舞台现场:

向音乐新品类进化的关键前提在于:AI 创作的质量正突破临界点。为此 Mureka V8 在歌曲的演绎上更上一层楼,歌词、旋律、编曲皆有显著的进步,并从以下两大维度进一步优化:
一是,作品的成熟度与可用性。Mureka V8 生成的音乐不再只是实验性片段,而是可以直接作为成品发布,真正成为创作工作流的一部分。
二是,人声的突破。Mureka V8 的人声告别了「机械式念词」,带上了更多情绪与张力,故事感更浓厚,听感更抓耳。
在与 Suno V5 的较量中,Mureka V8 在专业音乐人参评的音乐旋律性、人声表现力、编曲 / 结构、情绪表达与渲染等主观指标上全面胜出,延续了对这个老对手的优势。

在谈到 AI 音乐为何能够进化为一种新品类时,昆仑天工董事长兼 CEO 周亚辉表示,「AI 音乐相较于传统音乐的一大优势是,它能够集成进所有你想要的乐器。AI 音乐有望成为流行、R&B、嘻哈、摇滚四大音乐品类之外的第五大音乐品类。」

周亚辉
进入 Mureka 官网,选择最新的「V8」版本。

此前在测试 Mureka V6 的时候,我们让它生成过一首《春之舞》,AI 歌手的人声已经很清楚,旋律也不错。更新两代之后的 V8,势必更强,结果也确实如此。
我们让它来创作一首中文歌《冬之殇》,提示词是这样的:
一首深沉、孤寂、充满叙事感的艺术流行歌曲,具有电影配乐般的画面感与情感张力。旋律优美而哀伤,以钢琴和弦乐为主导,搭配缓慢而沉重的节拍,营造出冬日的凛冽与内心的荒芜感。歌词围绕 “逝去”、“遗忘’”、“漫长的告别”、“寂静中的回响” 展开,描绘冬天作为终点与见证者的意象,中文歌词需富有诗歌的凝练与隐喻。
等了不到半分钟,Mureka V8 就生成了一首时长近 3 分钟、名为《冬日的漫长告别》的抒情歌曲:

这一首歌,就几乎将 Mureka V8 的核心亮点囊括在内:
一是结构丰富,从前奏、主歌、副歌,层层递进。同时,旋律与情感彼此交织,主歌旋律起伏较小,语速较慢,情感含而未发。进到副歌,旋律明显拉高并变得开阔,情感张力达到顶峰并倾泻而出。穿插进来的大量「呜~」吟唱给听者留出了呼吸与共情的间隙。
二是歌词的故事性与画面感很强,通过徐徐展开的方式讲述故事,让听者仿佛在翻阅一本旧相册,并置身其中。
三是编曲讲究,尤其是乐器选用和进入时机。整首歌以钢琴为主基调,突出了冬日的冷色调。弦乐的加入又为歌曲增添了厚度。
生成的作品支持二次创作,包括局部编辑、延长与裁剪,赋予了创作者更高的自由度与可玩性。这里我们体验了延长功能,在延续原曲风格的基础上增加了留白:

续写的歌词:冬日终会走远,而这份告别,是写给春天最长的信。
此外,创作完成的歌曲能够即时发布,缩短了从素材生产到成品分发的路径,实现灵感的随创随发。这也是此次 Mureka V8 对音乐生成质量自信的表现。

第一首就这么赞,我们接着让 Mureka V8 来一段欢快的「R&B 情歌」,看它能不能 hold 住。输入以下提示词:
“请以‘暧昧升温 | 微醺时刻的吸引力’为核心场景,生成一首结构完整的当代 R&B 歌曲。要求包含:一段以反拍吉他引入的前奏、主歌部分体现含蓄试探、副歌部分旋律性感抓耳、并设计一个桥段来展现关系突破的瞬间。歌词需要充满双关和暧昧的想象力。”
并且,这次生成增加了一个环节,让它参考周杰伦的《龙卷风》,并选定曲风(R&B)、情绪(欢快)。

结果出来后依旧非常惊艳,R&B 味扑面而来,尤其是人声表现。以往的 AI 人声有时会被吐槽像一个咬字精准但缺少感情的「发声机器」,在听感上游离于背景之外。
现在,Mureka V8 仿佛为人声注入了一个统一而鲜明的人格,像人类歌手那样去「演绎」,情感与歌词以及背后的故事几乎没有脱节,真正具备了主唱气场。

最近几年,古风流行歌曲屡屡能够在网络上红极一时。我们也让 Mureka V8 生成了两首不同风格的古风歌曲,先是一首「婉约江南风」:

提示词:生成一首婉约细腻的现代国风歌曲,主题是 “春日离别”。核心意境:烟雨朦胧的江南渡口,折柳送别时的欲说还休。音乐要求:使用五声音阶,主旋律由竹笛和古筝交织呈现,节奏舒缓如流水。结构特色:主歌部分用女性清亮嗓音叙事,副歌部分旋律起伏加大,融入戏曲小腔。编曲融合:背景铺陈细腻的电子氛围音色,搭配零星的中国鼓点,尾奏渐渐加入雨声音效,整体混音空灵而有层次。
再来一首「武侠江湖风」,这里使用了 Mureka V8 的自定义模式,自动为提示词生成歌词,并选定风格与人声。

提示词:电影感中国风音乐,史诗风格,快节奏,厚重的中式打击乐,琵琶与二胡,有力男声演唱,充满英雄气概,武侠风格,管弦乐融合。
气势磅礴、刀光剑影呼之欲出:

下面是一首相同风格的英文歌:

这几首歌听下来,只留给了我一个大大的问号:如果不事先告知,我们真的还能分清它们是 AI 生成还是真人创作的吗?
Mureka V8 让 AI 音乐进一步摆脱了僵硬感、拼凑感、千篇一律以及言之无物等以往音乐生成模型存在的通病。这一切在技术上要归功于昆仑万维自研的「MusiCoT」,一种专为音乐生成打造的思维链(CoT)提示方法。
该方法受到了语言建模中 CoT 提示技术的启发,通过一系列创新补上了传统自回归音乐生成模型偏离人类创作模式的短板。
一方面,引入了中间推理,让模型预定义整体音乐结构以及风格、乐器等相关的元素,然后再生成音频 token;另一方面,利用对比语言 - 音频预训练(CLAP)架构来定义音乐 CoT, 在同一个空间中对文本与音频进行学习和训练,让二者匹配度更高。

MusiCoT 整体框架。
从 Mureka V6 开始到今天的 Mureka V8,它们实现 SOTA 效果的背后,都离不开 MusiCoT 像人类创作者一样自主「思考」词曲、旋律、情绪,并形成了该系列模型的技术护城河。
基于 MusiCoT 技术,Mureka V8 不再机械地拼接音频,而是模仿人类创作思维,在理解段落结构、和声推进与情绪铺陈的基础上,让音乐叙事更加完整。
与此同时,人声建模技术是 Mureka V8 能够「告别 AI 味唱腔」的另一大关键因素。
两项技术加持下,AI 在理解音乐生成逻辑的路上更进了一步,不像以往只是一味地把好听的采样硬凑在一起,而开始懂得了铺垫、高潮在内的起承转合,并具备了驾驭宏大叙事的能力。
一直以来,与其他 AIGC 工具一样,AI 音乐模型被定义为了「辅助创作工具」与「效率提升工具」,可以利用它们激发灵感、批量生成手稿、缩短创作周期。
在很多人看来,AI 创作归根结底是基于训练数据的模仿与重组,而非发自内心的表达。因此,AI 音乐往往被认为缺乏情感与灵魂,并且存在同质化的问题,无法形成吸引人的独特审美。
不过,随着模型与算法的迭代升级,如今的 AI 已经能够生成有深度有温度的作品。此次的 Mureka V8 就是很好的例子,不仅在结构完整性、旋律连贯性、人声拟真性上更强,其整体音乐性、情感表达性也让所有人眼前一亮。
能力上的跃升,驱动昆仑天工提出了更宏大的愿景:推动 AI 音乐成为一种独立的、有辨识度的音乐新品类。
这种对 AI 音乐本质的重新定义,势必会带来包括创作主体、内容表达与产业形态在内的联动革新。随之而来,我们或许会进入一个 AI 音乐创作的全新纪元。
在这个新纪元中,人类创作者与 AI 的协同更加强调共生共创,内容表达的边界得到极大拓展,并在打通模型、社区、工具和服务全链路的基础上构筑起一个更加繁荣的消费生态。
对于包括昆仑天工在内的所有业界玩家来说,将 AI 音乐打造成新品类既是挑战,也是机遇,拼的就是谁能更早更快地占领这一生态阵地。显然,昆仑天工走在了前面。
一方面持续打磨 Mureka 基模能力,自 2024 年 2 月 1.0 版本问世以来,在近两年时间里历经近十次迭代,不断突破 AI 音乐的上限;另一方面重视模型即产品能力,降低 C 端创作者的使用门槛,易用性更强的同时对用户更友好。
此次会上,Mureka 宣布将推出 AI Studio,专门为专业创作者打造一个更完整、更可控的音乐创作环境,通过更深度的编辑、结构调整和创作管理功能,提升 AI 在专业创作流程中的参与度。当然,该 Studio 也考虑到了新创作者的需求,保留了简单易用的体验。
借助 Mureka Studio,昆仑天工想要重塑音乐创作范式,将创作者从操作技巧中解放出来,让创作回归到「想法」和「审美」本身。
这意味着,未来的创作者只需要像导演一样指挥全局,提出清晰的创意构想,然后将大量细粒度的执行工作交给 AI 来高效完成,包括情绪铺垫与推进、乐器演奏、主副歌衔接、人声混音等等。这种创作维度上的升级,可以构建出前所未有的听觉体验。

Mureka Studio 创作者内测正在火热进行中
同时在 B 端,Mureka 将继续巩固其作为「全球首批开放 API 服务、全球首个开放模型微调功能」的平台优势。
其中 Mureka API 在满足基本的音乐生成需求之外,通过完整的接口封装将深度创作的控制权交由终端用户,让他们可以结合歌词、人声和参考歌曲进行定制与调整。配合针对音乐创作和视频创作等全场景的模型微调服务以及未来全面开放的 AI Studio 能力,我们可以期待 Mureka 在更更多样化的商业场景与应用中发挥自己的价值。
此外,昆仑天工还宣布与太和音乐达成战略合作,为 AI 创作者提供流量扶持与变现机会。两者的强强联合将推动更多人参与到 AI 音乐创作的行列中来,还可能加速 AI 音乐进入商业化、正版化的落地阶段。
当 AI 音乐成为一种新的品类,Al 版「Spotify」会成为行业的灯塔。昆仑天工愿以一个先行者的姿态,为音乐产业的全新生态铺路。
文章来自于“机器之心”,作者 “机器之心编辑部”。
【开源免费】suno-api是一个使用监听技术实现了调用suno功能,并封装好API的AI音乐项目。
项目地址:https://github.com/gcui-art/suno-api
【开源免费】字节工作流产品扣子两大核心业务:Coze Studio(扣子开发平台)和 Coze Loop(扣子罗盘)全面开源,而且采用的是 Apache 2.0 许可证,支持商用!
项目地址:https://github.com/coze-dev/coze-studio
【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址:https://github.com/n8n-io/n8n
在线使用:https://n8n.io/(付费)
【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file
【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用:https://vectorvein.ai/(付费)
【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。
项目地址:https://github.com/InternLM/xtuner
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0