温馨提示:本站为乐享票务官方授权演出订票中心,请放心购买。
你现在的位置:首页 > 演出资讯  > 音乐会

首款音乐推理模型Mureka O1!爆改周杰伦,AI音乐进入DeepSeek时刻

更新时间:2025-03-26 17:25  浏览量:4

编辑:编辑部 HNZY

【新智元导读】AI音乐,从此进入「会思考」的时代!刚刚,昆仑万维扔出一枚重磅炸弹——全球首款音乐推理大模型Mureka O1横空出世,实力碾压Suno,强势登顶TOP 1。

国内首个音乐ChatGPT,刚刚又迎来了震撼升级。

就在刚刚,昆仑万维发布了全球首款音乐推理大模型Mureka O1,一举把Suno拉下王座,登顶TOP 1。

可以说,这个全球首发的模型,自今日起直接开启了AI音乐的工业革命,彻底重塑了音乐创作范式!

首先,这次的基座模型Mureka V6,就已经大大优化。

而在此基础上,它的推理优化版本Mureka O1更是强到发指,因为它融入了CoT技术,学会了思考!

学会思考的音乐AI模型,当然比普通的音乐AI,更多了那么一丝「人味」。

基座模型Mureka V6:引入ICL技术,声场更开阔,人声质感和混音设计强化

首款音乐推理大模型Mureka O1:学会思考,音乐的结构连贯性、乐器编排精准度大提升

更劲爆的是,Mureka V6如今还能支持10种语言,基本把全球主要国家和用户一网打尽。可以想见,它离引爆全球音乐市场的一天,已经不远了!

而现在,AI也能独立出专辑了!《Mureka》AI音乐人MV全网首发,该作品由AI生成,Mureka负责声乐,SkyReels操刀动画。

从音乐到数字人的形象,可与韩国女团同台PK,简直声画双绝。

音乐创作范式,彻底重塑

为什么说,Mureka即将成为一匹行业黑马,彻底颠覆音乐创作范式?

答案,就写在它的工作流中。

· 多语言创作,文化壁垒彻底打破

想象一下,从此音乐人们再也不必受语言的限制,可以使用全球10种主流语言尽情创作音乐,这将赋予音乐人多么广阔的创作空间!

支持美欧亚主流语言歌词和音乐的Mureka,能让人尽情挥洒创作灵感,将事业空间拓展到国际舞台。

无论热情的拉丁节奏,还是深沉的电子音乐,抑或是古香古色的传统国风,O1能让你真正成为音乐王国的世界公民。

更厉害的是,这10种语言已经覆盖了全球大部分国家和地区,它在全球音乐市场掀起的影响力,着实不可小觑。

断眉和维兹的《See You Again》,是一首在国内家喻户晓的流行金曲,我们贴上中文歌词,直接就能来一个汉化版。

· 爆改网络红曲,花样玩法多

前者可以让我们上传一首歌后,以不同语言重新填词,这样就能保留原曲旋律,生成自己的歌。

电影《哪吒之魔童闹海》的角色曲《就是哪吒》,此前就在网上掀起了一股翻唱的风潮。

再让我们试试,让Mureka生成它的英文歌翻唱版。

果然,这首《就是哪吒》英文版,同样旋律激昂,歌词充满力量,很有一股「将这混沌的世界翻个天」的感觉。

· 一段Prompt,一键定制想要的BGM

需输入场景描述性Prompt,即可生成与特定场景完美契合的完整背景音乐。

现在,只要输入一个场景的描述性Prompt,O1就能根据你的需求,生成与特定场景完美契合的完整BGM了。

电影、游戏、广告行业,无疑将迎来大震荡级的剧变。

· 音轨分离下载,创作更自由

更妙的是,O1还能提供多轨音频输出——人声、伴奏、吉他、鼓点……每一层都能独立下载!

这就意味着,我们可以自由进行混音、二次创作、重新编排,甚至把它做成属于自己的独特作品。

对于音乐制作人,甚至是想要自制单曲的小白,这项功能都太强大了。

此外,O1系统还支持行业最好的音色克隆功能。它会精准模拟歌手音色,一键生成个性化专属作品。

一手实测,好听到上头

接下来,就是一大波更多实测来袭!

现在,打开官网www.mureka.ai,每个人都可以上手实测了。Mureka O1和Mureka V6两款模型全量上线,可自由切换。

不论是哪款模型,都支持20多种歌曲创作曲风和情绪,包括爵士、电子、流行、乡村、R&B等,情绪快乐、放纵、神秘、充满活力、悲伤等。

Mureka O1:替代人类音乐家,不是说说而已

不管是人声还是伴奏,Mureka O1做出的音乐,基本做到完全去「AI味」,基本很难听出是AI模型生成的了。

· 经典华语金曲,衍生出全新歌曲

接下来,让我们重点实测一番Mureka的根据参考歌曲生成新歌的功能。

要知道,将音乐本身作为提示,要比文本提示更加精准,可直接上传音频/粘贴YouTube链接即可。

这里,我们选择了周杰伦的流行乐——「最长的电影」作为参考歌曲,然后让AI自动生成一段歌词。

AI帮忙创作出了一段爱而不得的经典系列,一首「错身」留足了遗憾感的空间。

接下来,点击创作,一首衍生曲就诞生了!

前调有点「彩虹」、「晴天」的味道,全曲将周董那种细腻的忧伤感,充分地刻画了出来。

· Soul、R&B、Pop,爆款音乐风格一网打尽

首先来听一首Soul,开头几句就被惊艳到了,味儿非常纯正。

转音如此丝滑,完全可媲美人类歌手。B段的前几个乐句十分抓耳,已经有了爆款流行曲的潜质。

总的来说,整首歌无论是旋律、配乐还是演唱,都堪称上乘。

再来一首R&B。

一首好的R&B,是节奏、旋律、情感表达和歌手演唱技巧天衣无缝的完美融合。而Mureka O1创作的这首R&B,在各方面都可以说拿到了高分。

从一开始,这首歌的旋味就非常强,充满了呼吸感,节奏、律动和乐器配合出了非常惬意和带劲的丝滑感。

尤其把我们抓住的,是从46秒开始的一段前奏,结合鼓点的设计,一下子让人耳朵一亮。

要说最能考验AI音乐模型的功力,大概就Pop了。这是最主流的音乐形式之一,普通大众觉得好听,才能流行起来。

那让我们看看,Mureka O1写出的Pop,能成为人类世界大街小巷的爆款当红曲目吗?

可以说,这首已经算一首合格的流行音乐了,十分符合大众审美。

旋律抓耳又流畅,曲调轻松愉悦,十分有公路氛围,跟乘车兜风的场景不要太适配。叠加了不同音色的编曲营造出动态的层次感,演唱者的音色、咬字、情绪感染力也很强。

一首Rock曲风的中文歌,仿佛狂野里的疾驰,编曲很炸,歌词很燃,旋律带着呐喊青春的倔强和热血。

而这首欢快的流行歌,从前奏就能感受到夏天的味道。惬意轻快的小调,让人一瞬间拥有了度假的明亮心情。

· Mureka O1 PK SUNO V4:大获全胜

在实测中可以发现,Mureka O1已经完胜了Suno V4。

仔细听就会发现,Suno V4生成的人声有些不自然,人声也比较远。

而Mureka O1的音乐不仅一耳朵听上去质量就很高,人声也更自然,离耳朵也近。

Mureka V6:一键十种语言,BGM随心造

而对于那些对音频质量要求没那么高、又想尝试玩一把音乐的人,选用最新升级后的Mureka V6就够了。

它最大的亮点在于,可支持纯音乐的生成,以及10种语言的AI音乐创作,包括英语、西班牙语、中文、日语、韩语、葡萄牙语、德语、意大利语、法语、俄语。

同时,相较于上一代V5.5,在人声清晰度、专业混音、编曲歌词等方面,得到了显著提升。

Mureka V6一次就可以生成4.5分钟的音频,足够一首歌的时间了。

现在,就让我们来上手实测一番它的音乐创作功能。

文本框内输入「Latin song」,拉丁风的音乐《Amores Meos》就快速生成了!

每次Mureka V6都会一次性生成两首音乐,这次一共有一首纯音乐,一首西语歌曲。

风格热情奔放,节奏明快,一秒就能把你带到洒着阳光的地中海海岸线,随着街拍自由舞动。

超越Suno,Mureka O1稳坐AI音乐王座

不久以前,DeepSeek-R1凭借思维链(CoT)技术显著提升了模型的智能水平,迅速火爆全球。

那你能想到,当CoT被应用到音乐领域,会创造出怎样的奇迹吗?

当CoT首次应用到音乐

今天,Mureka O1全球首次将CoT用到了音乐生成领域,这一创举彻底颠覆了传统AI音乐生成范式。

CoT的核心在于「思考与优化」,它让模型在生成音乐之前,先进行多步骤推理和自我批判。

这种「类人脑」的生成逻辑,使得Mureka O1在歌词旋律契合度、演唱准确性、艺术表现力上达到前所未有的高度。

从技术演进上看,Mureka O1并非一蹴而就。

去年,Mureka团队发布了初代Mureka V1(SkyMusic),并在近一年时间里持续迭代升级。

如今,全新基座模型Mureka V6横空出世,首次引入ICL(in-context learning)后,显著强化了声场开阔度、人声质感、混音设计。

而Mureka O1正是基于Mureka V6之上的「推理增强版」,在CoT加持下,将音乐品质推向极致。

在与主流音乐模型Suno V4等主流客观评测中,O1以压倒性优势,证明了自己的王者地位。

评测选用了100条英文Prompt,每款模型在相同的提示下,分别生成100条英文歌曲进行横向对比。

结果可以看出,Mureka O1在发音错词率、乐段准确率、制作质量等客观指标,在行业中处于领先位置。

Mureka O1在文本生成音乐的客观测评中得分

当然,音乐的魅力最终取决于人的聆听体验,因此主观与客观评价缺一不可。

主观测评中,Mureka O1以出色的音乐品质全面超越Suno V4,尤其在整体听感上占据优势。

而且,其乐器演奏的多样性与配器设计的精妙程度远超对手,同时在音质、人声表现,以及BGM质感上实现显著提升。

Mureka O1在主观测评中整体听感超越Suno V4

不仅如此,O1/V6的生成速度,也令人叹服。

不管是生成音乐的耗时,还是可完整下载的耗时,它们皆能完胜对手,能提供即时、高质量的创作体验。

Mureka O1实现了行业领先的低延时音乐生成

无论是发音清晰程度,还是生成乐段的精准度与自然结束率,Mureka O1都稳稳占据AI音乐的「C位」。

能够碾压Suno V4,它的秘密武器是什么?

业界首创MusiCoT框架

Mureka O1的背后,是团队倾力打造的MusiCoT框架。

这不仅是CoT在音乐领域的首次应用,更是一次结构化生成的革命性尝试。

论文地址:MusiCoT.github.io

MusiCoT跳脱了传统模型的局限,先通过全局视角预生成音乐结构,在精细化填充音频细节。

具体来说,从主歌、副歌到过渡段,再到细粒度音频token的填充中。

这种「从宏观到微观」的生成逻辑,确保了音乐在连贯性、层次感、艺术性上的极致表现。

更令人惊叹的是,MusiCoT基于CLAP模型构建,无需人工标注即具备高扩展性,大幅提升生成音乐可解释性与艺术感染力。

只需要输入一个场景提示,Mureka O1几秒内即可输出媲美专业水准的音乐作品。

Mureka O1还提供独立的人声、伴奏等多轨输出,极大方便用户后续混音与二次创作。

可以说,MusiCoT为高保真AI音乐生成开辟了全新路径,推动音乐AI创作迈入结构化时代。

开放API,共建AI音乐开发者生态

面向企业和开发者,Mureka同时开放两大类灵活的API服务,不仅包括音乐音频生成API,还有语音合成API。

1. 音乐API

标准音乐生成API:支持多种输入包括文本提示、音色参考、音频参考的音乐生成,歌词创作。通过不同维度的输入,系统可生产多风格音乐及纯音乐,适用于内容创作、游戏配乐、短视频等多场景应用精调私有曲库API:上传私有曲库定制专属风格,模型精调技术深度解析每一首旋律风格偏好,无需音乐知识也可轻松定制品牌音乐、个人专辑等专属内容

2. 语音API

AI语音播客、精品说话人、音色克隆等API,用于语音播客、预制精品音色语音合成、音色克隆等场景

不仅如此,Mureka也同步开发前沿语音合成API:Mureka TTS。

Mureka TTS在与ElevenLabs、OpenAI、微软的横向评测中表现出色,对话聊天类全场景效果与一线厂商不相上下。

在聊天对话类文本数据上,Mureka TTS整体听感达到了4.34分

Mureka成为全球首个开放模型微调的AI音乐平台,并开放了基于最新V6模型微调服务。

开发者可上传私有数据,训练专属模型,而且数据严格保密,不会被用于基座模型的训练。

有了这项功能,不论是音乐人、制作人,还是品牌与游戏开发者,都能打造出独一无二的专辑。

要知道,Mureka的10种语言,基本包圆了全球大部分国家和地区。

而这,就意味着ToB巨大的市场规模!

目前,Mureka已经拥有了超过100多个国家和地区的用户。而在以往的出海经验中,昆仑万维已经观察到,内容、娱乐赛道的用户和收入增长都十分明显。

其实在这方面,昆仑万维已经拥有了成功先例,比如之前推出的一款K歌产品Star Maker,已经在海外几十个国家上线,历史注册用户直接突破3.1亿。

而内容和娱乐赛道C端应用的特点,就是用户对AI输出容错率较高,因此也拥有极高的市场上限。全球80亿人即使只有1%的用户买单,也会形成惊人的规模收入!

一句话就是,Mureka的商业化前景,潜力惊人。

AI音乐市场爆发,Mureka解锁新世界

音乐是人类情感的共鸣,而AI正在让它变得更丰富、更触手可及。

市场数据,也从印证了AI生成音乐领域的无限潜力。

Fortune Business Insights数据显示,2023年全球数字音频工作站(DAW)市场规模已达约30亿美元,预计到2026年,约70%的DAW企业将使用AI技术辅助音乐创作。

进一步市场研究表明,GlobeNewswire预测全球DAW市场规模到2032年将超过66.2亿美元,2024年-2032年的复合年增长率为8.6%。

昆仑万维敏锐地捕捉这一风口,以「All in AGI与AIGC」战略驱动,在实现AGI道路上步履不停。

Mureka正是这一布局的明星选手,它不仅体现了昆仑万维将技术转化为生产力的决心,也让我们看到一个更宏大的愿景——让每个人更好地塑造和表达自我。

值得一提的是,Mureka的名字源自「Music」和「Eureka」的结合,寓意灵感迸发的「尤里卡时刻」。

它不仅仅是一款工具,更是AI音乐浪潮中的先行者,赋能每个人成为创作者。

如今,Mureka已蓄势待发,等你来解锁它的无限可能。