首款音乐推理模型Mureka O1！爆改周杰伦，AI音乐进入DeepSeek时刻

发布时间：2025-03-26 17:25:34 浏览量：51

编辑：编辑部 HNZY

【新智元导读】AI音乐，从此进入「会思考」的时代！刚刚，昆仑万维扔出一枚重磅炸弹——全球首款音乐推理大模型Mureka O1横空出世，实力碾压Suno，强势登顶TOP 1。

国内首个音乐ChatGPT，刚刚又迎来了震撼升级。

就在刚刚，昆仑万维发布了全球首款音乐推理大模型Mureka O1，一举把Suno拉下王座，登顶TOP 1。

可以说，这个全球首发的模型，自今日起直接开启了AI音乐的工业革命，彻底重塑了音乐创作范式！

首先，这次的基座模型Mureka V6，就已经大大优化。

而在此基础上，它的推理优化版本Mureka O1更是强到发指，因为它融入了CoT技术，学会了思考！

学会思考的音乐AI模型，当然比普通的音乐AI，更多了那么一丝「人味」。

基座模型Mureka V6：引入ICL技术，声场更开阔，人声质感和混音设计强化

首款音乐推理大模型Mureka O1：学会思考，音乐的结构连贯性、乐器编排精准度大提升

更劲爆的是，Mureka V6如今还能支持10种语言，基本把全球主要国家和用户一网打尽。可以想见，它离引爆全球音乐市场的一天，已经不远了！

而现在，AI也能独立出专辑了！《Mureka》AI音乐人MV全网首发，该作品由AI生成，Mureka负责声乐，SkyReels操刀动画。

从音乐到数字人的形象，可与韩国女团同台PK，简直声画双绝。

音乐创作范式，彻底重塑

为什么说，Mureka即将成为一匹行业黑马，彻底颠覆音乐创作范式？

答案，就写在它的工作流中。

· 多语言创作，文化壁垒彻底打破

想象一下，从此音乐人们再也不必受语言的限制，可以使用全球10种主流语言尽情创作音乐，这将赋予音乐人多么广阔的创作空间！

支持美欧亚主流语言歌词和音乐的Mureka，能让人尽情挥洒创作灵感，将事业空间拓展到国际舞台。

无论热情的拉丁节奏，还是深沉的电子音乐，抑或是古香古色的传统国风，O1能让你真正成为音乐王国的世界公民。

更厉害的是，这10种语言已经覆盖了全球大部分国家和地区，它在全球音乐市场掀起的影响力，着实不可小觑。

断眉和维兹的《See You Again》，是一首在国内家喻户晓的流行金曲，我们贴上中文歌词，直接就能来一个汉化版。

· 爆改网络红曲，花样玩法多

前者可以让我们上传一首歌后，以不同语言重新填词，这样就能保留原曲旋律，生成自己的歌。

电影《哪吒之魔童闹海》的角色曲《就是哪吒》，此前就在网上掀起了一股翻唱的风潮。

再让我们试试，让Mureka生成它的英文歌翻唱版。

果然，这首《就是哪吒》英文版，同样旋律激昂，歌词充满力量，很有一股「将这混沌的世界翻个天」的感觉。

· 一段Prompt，一键定制想要的BGM

需输入场景描述性Prompt，即可生成与特定场景完美契合的完整背景音乐。

现在，只要输入一个场景的描述性Prompt，O1就能根据你的需求，生成与特定场景完美契合的完整BGM了。

电影、游戏、广告行业，无疑将迎来大震荡级的剧变。

· 音轨分离下载，创作更自由

更妙的是，O1还能提供多轨音频输出——人声、伴奏、吉他、鼓点……每一层都能独立下载！

这就意味着，我们可以自由进行混音、二次创作、重新编排，甚至把它做成属于自己的独特作品。

对于音乐制作人，甚至是想要自制单曲的小白，这项功能都太强大了。

此外，O1系统还支持行业最好的音色克隆功能。它会精准模拟歌手音色，一键生成个性化专属作品。

一手实测，好听到上头

接下来，就是一大波更多实测来袭！

现在，打开官网www.mureka.ai，每个人都可以上手实测了。Mureka O1和Mureka V6两款模型全量上线，可自由切换。

不论是哪款模型，都支持20多种歌曲创作曲风和情绪，包括爵士、电子、流行、乡村、R&B等，情绪快乐、放纵、神秘、充满活力、悲伤等。

Mureka O1：替代人类音乐家，不是说说而已

不管是人声还是伴奏，Mureka O1做出的音乐，基本做到完全去「AI味」，基本很难听出是AI模型生成的了。

· 经典华语金曲，衍生出全新歌曲

接下来，让我们重点实测一番Mureka的根据参考歌曲生成新歌的功能。

要知道，将音乐本身作为提示，要比文本提示更加精准，可直接上传音频/粘贴YouTube链接即可。

这里，我们选择了周杰伦的流行乐——「最长的电影」作为参考歌曲，然后让AI自动生成一段歌词。

AI帮忙创作出了一段爱而不得的经典系列，一首「错身」留足了遗憾感的空间。

接下来，点击创作，一首衍生曲就诞生了！

前调有点「彩虹」、「晴天」的味道，全曲将周董那种细腻的忧伤感，充分地刻画了出来。

· Soul、R&B、Pop，爆款音乐风格一网打尽

首先来听一首Soul，开头几句就被惊艳到了，味儿非常纯正。

转音如此丝滑，完全可媲美人类歌手。B段的前几个乐句十分抓耳，已经有了爆款流行曲的潜质。

总的来说，整首歌无论是旋律、配乐还是演唱，都堪称上乘。

再来一首R&B。

一首好的R&B，是节奏、旋律、情感表达和歌手演唱技巧天衣无缝的完美融合。而Mureka O1创作的这首R&B，在各方面都可以说拿到了高分。

从一开始，这首歌的旋味就非常强，充满了呼吸感，节奏、律动和乐器配合出了非常惬意和带劲的丝滑感。

尤其把我们抓住的，是从46秒开始的一段前奏，结合鼓点的设计，一下子让人耳朵一亮。

要说最能考验AI音乐模型的功力，大概就Pop了。这是最主流的音乐形式之一，普通大众觉得好听，才能流行起来。

那让我们看看，Mureka O1写出的Pop，能成为人类世界大街小巷的爆款当红曲目吗？

可以说，这首已经算一首合格的流行音乐了，十分符合大众审美。

旋律抓耳又流畅，曲调轻松愉悦，十分有公路氛围，跟乘车兜风的场景不要太适配。叠加了不同音色的编曲营造出动态的层次感，演唱者的音色、咬字、情绪感染力也很强。

一首Rock曲风的中文歌，仿佛狂野里的疾驰，编曲很炸，歌词很燃，旋律带着呐喊青春的倔强和热血。

而这首欢快的流行歌，从前奏就能感受到夏天的味道。惬意轻快的小调，让人一瞬间拥有了度假的明亮心情。

· Mureka O1 PK SUNO V4：大获全胜

在实测中可以发现，Mureka O1已经完胜了Suno V4。

仔细听就会发现，Suno V4生成的人声有些不自然，人声也比较远。

而Mureka O1的音乐不仅一耳朵听上去质量就很高，人声也更自然，离耳朵也近。

Mureka V6：一键十种语言，BGM随心造

而对于那些对音频质量要求没那么高、又想尝试玩一把音乐的人，选用最新升级后的Mureka V6就够了。

它最大的亮点在于，可支持纯音乐的生成，以及10种语言的AI音乐创作，包括英语、西班牙语、中文、日语、韩语、葡萄牙语、德语、意大利语、法语、俄语。

同时，相较于上一代V5.5，在人声清晰度、专业混音、编曲歌词等方面，得到了显著提升。

Mureka V6一次就可以生成4.5分钟的音频，足够一首歌的时间了。

现在，就让我们来上手实测一番它的音乐创作功能。

文本框内输入「Latin song」，拉丁风的音乐《Amores Meos》就快速生成了！

每次Mureka V6都会一次性生成两首音乐，这次一共有一首纯音乐，一首西语歌曲。

风格热情奔放，节奏明快，一秒就能把你带到洒着阳光的地中海海岸线，随着街拍自由舞动。

超越Suno，Mureka O1稳坐AI音乐王座

不久以前，DeepSeek-R1凭借思维链（CoT）技术显著提升了模型的智能水平，迅速火爆全球。

那你能想到，当CoT被应用到音乐领域，会创造出怎样的奇迹吗？

当CoT首次应用到音乐

今天，Mureka O1全球首次将CoT用到了音乐生成领域，这一创举彻底颠覆了传统AI音乐生成范式。

CoT的核心在于「思考与优化」，它让模型在生成音乐之前，先进行多步骤推理和自我批判。

这种「类人脑」的生成逻辑，使得Mureka O1在歌词旋律契合度、演唱准确性、艺术表现力上达到前所未有的高度。

从技术演进上看，Mureka O1并非一蹴而就。

去年，Mureka团队发布了初代Mureka V1（SkyMusic），并在近一年时间里持续迭代升级。

如今，全新基座模型Mureka V6横空出世，首次引入ICL（in-context learning）后，显著强化了声场开阔度、人声质感、混音设计。

而Mureka O1正是基于Mureka V6之上的「推理增强版」，在CoT加持下，将音乐品质推向极致。

在与主流音乐模型Suno V4等主流客观评测中，O1以压倒性优势，证明了自己的王者地位。

评测选用了100条英文Prompt，每款模型在相同的提示下，分别生成100条英文歌曲进行横向对比。

结果可以看出，Mureka O1在发音错词率、乐段准确率、制作质量等客观指标，在行业中处于领先位置。

Mureka O1在文本生成音乐的客观测评中得分

当然，音乐的魅力最终取决于人的聆听体验，因此主观与客观评价缺一不可。

主观测评中，Mureka O1以出色的音乐品质全面超越Suno V4，尤其在整体听感上占据优势。

而且，其乐器演奏的多样性与配器设计的精妙程度远超对手，同时在音质、人声表现，以及BGM质感上实现显著提升。

Mureka O1在主观测评中整体听感超越Suno V4

不仅如此，O1/V6的生成速度，也令人叹服。

不管是生成音乐的耗时，还是可完整下载的耗时，它们皆能完胜对手，能提供即时、高质量的创作体验。

Mureka O1实现了行业领先的低延时音乐生成

无论是发音清晰程度，还是生成乐段的精准度与自然结束率，Mureka O1都稳稳占据AI音乐的「C位」。

能够碾压Suno V4，它的秘密武器是什么？

业界首创MusiCoT框架

Mureka O1的背后，是团队倾力打造的MusiCoT框架。

这不仅是CoT在音乐领域的首次应用，更是一次结构化生成的革命性尝试。

论文地址：MusiCoT.github.io

MusiCoT跳脱了传统模型的局限，先通过全局视角预生成音乐结构，在精细化填充音频细节。

具体来说，从主歌、副歌到过渡段，再到细粒度音频token的填充中。

这种「从宏观到微观」的生成逻辑，确保了音乐在连贯性、层次感、艺术性上的极致表现。

更令人惊叹的是，MusiCoT基于CLAP模型构建，无需人工标注即具备高扩展性，大幅提升生成音乐可解释性与艺术感染力。

只需要输入一个场景提示，Mureka O1几秒内即可输出媲美专业水准的音乐作品。

Mureka O1还提供独立的人声、伴奏等多轨输出，极大方便用户后续混音与二次创作。

可以说，MusiCoT为高保真AI音乐生成开辟了全新路径，推动音乐AI创作迈入结构化时代。

开放API，共建AI音乐开发者生态

面向企业和开发者，Mureka同时开放两大类灵活的API服务，不仅包括音乐音频生成API，还有语音合成API。

1. 音乐API

标准音乐生成API：支持多种输入包括文本提示、音色参考、音频参考的音乐生成，歌词创作。通过不同维度的输入，系统可生产多风格音乐及纯音乐，适用于内容创作、游戏配乐、短视频等多场景应用精调私有曲库API：上传私有曲库定制专属风格，模型精调技术深度解析每一首旋律风格偏好，无需音乐知识也可轻松定制品牌音乐、个人专辑等专属内容

2. 语音API

AI语音播客、精品说话人、音色克隆等API，用于语音播客、预制精品音色语音合成、音色克隆等场景

不仅如此，Mureka也同步开发前沿语音合成API：Mureka TTS。

Mureka TTS在与ElevenLabs、OpenAI、微软的横向评测中表现出色，对话聊天类全场景效果与一线厂商不相上下。

在聊天对话类文本数据上，Mureka TTS整体听感达到了4.34分

Mureka成为全球首个开放模型微调的AI音乐平台，并开放了基于最新V6模型微调服务。

开发者可上传私有数据，训练专属模型，而且数据严格保密，不会被用于基座模型的训练。

有了这项功能，不论是音乐人、制作人，还是品牌与游戏开发者，都能打造出独一无二的专辑。

要知道，Mureka的10种语言，基本包圆了全球大部分国家和地区。

而这，就意味着ToB巨大的市场规模！

目前，Mureka已经拥有了超过100多个国家和地区的用户。而在以往的出海经验中，昆仑万维已经观察到，内容、娱乐赛道的用户和收入增长都十分明显。

其实在这方面，昆仑万维已经拥有了成功先例，比如之前推出的一款K歌产品Star Maker，已经在海外几十个国家上线，历史注册用户直接突破3.1亿。

而内容和娱乐赛道C端应用的特点，就是用户对AI输出容错率较高，因此也拥有极高的市场上限。全球80亿人即使只有1%的用户买单，也会形成惊人的规模收入！

一句话就是，Mureka的商业化前景，潜力惊人。

AI音乐市场爆发，Mureka解锁新世界

音乐是人类情感的共鸣，而AI正在让它变得更丰富、更触手可及。

市场数据，也从印证了AI生成音乐领域的无限潜力。

Fortune Business Insights数据显示，2023年全球数字音频工作站（DAW）市场规模已达约30亿美元，预计到2026年，约70%的DAW企业将使用AI技术辅助音乐创作。

进一步市场研究表明，GlobeNewswire预测全球DAW市场规模到2032年将超过66.2亿美元，2024年-2032年的复合年增长率为8.6%。

昆仑万维敏锐地捕捉这一风口，以「All in AGI与AIGC」战略驱动，在实现AGI道路上步履不停。

Mureka正是这一布局的明星选手，它不仅体现了昆仑万维将技术转化为生产力的决心，也让我们看到一个更宏大的愿景——让每个人更好地塑造和表达自我。

值得一提的是，Mureka的名字源自「Music」和「Eureka」的结合，寓意灵感迸发的「尤里卡时刻」。

它不仅仅是一款工具，更是AI音乐浪潮中的先行者，赋能每个人成为创作者。

如今，Mureka已蓄势待发，等你来解锁它的无限可能。

首款音乐推理模型Mureka O1！爆改周杰伦，AI音乐进入DeepSeek时刻

相似文章