温馨提示:本站为乐享票务官方授权演出订票中心,请放心购买。
你现在的位置:首页 > 演出资讯  > 音乐会

每日与世界30亿次交互!这家AI独角兽企业发布音乐生成模型

更新时间:2024-09-05 04:22  浏览量:4

输入一段简单的提示词,等待1—2分钟,可生成6秒的视频;没有伴奏,音乐模型也可以是实力歌手。8月31日,AI独角兽企业上海稀宇科技有限公司(以下简称MiniMax)“Link 伙伴日”在西岸漩心拉开帷幕。当日,MiniMax正式发布视频模型video-01以及音乐模型music-01。

据了解,相比市面上的视频模型,MiniMax视频模型具有压缩率高、文本响应好和风格多样等优点,可生成原生高分辨率、高帧率视频,模型能力首屈一指。

从今年2月OpenAI发布视频大模型Sora后,视频模型内卷明显,有多家AI企业先后发布大模型视频,包括智谱AI推出的视频生成模型“清影”、爱诗科技的PixVerse V2、生数科技的Vidu、快手的“可灵AI”、阿里达摩院的寻光等。

至于MiniMax为何要加入这场“内卷”,MiniMax创始人闫俊杰表示:“从生活中不难发现,文字交互只是很小的一部分,更多的是语音和视频交互。多模态的内容,比如声音、图文和视频,已经成为信息传递的主流。为了能够提高渗透率,多模态是必经之路。”

闫俊杰透露,目前video-01只提供了文生视频,在未来产品会迭代图生视频、可编辑、可控性等功能。

MiniMax第一款音乐模型music-01的推出也同样精彩,可以合成纯音乐为制作人快速构建歌曲的基本结构,由歌手自由演绎主唱或和声部分。没有伴奏,音乐模型也可以是实力歌手,清唱作品同样不在话下。值得一提的是,MiniMax语音模型已实现对粤语、日语、韩语、西班牙语等多语种支持的升级。

目前,MiniMax音乐生成模型与视频生成模型已经在开放平台和海螺AI网页版上线。新⼀版能从速度和效果都对标GPT-4o的大模型abab7,会在未来⼏周内发布。

作为中国首个研发MoE大语言模型并成功上线的AI企业,MiniMax持续在模型算法上做创新,并最新推出基于MOE+ Linear Attention的新一代模型技术。通过此新型线性模型架构,MiniMax大模型能在单位时间内更加高效地训练海量数据,极大地提升了模型的实用性和响应速度。在与GPT-4o同一代模型能力对比上,新一代模型处理10万token时效率可提升2~3倍,并且随着长度越长,提升越明显。

据统计,MiniMax每日与全球用户进行超30亿次交互,处理超3万亿文本token、2000万张图片和7万小时语音,大模型日处理交互量排名国内AI公司首位。

活动现场,MiniMax携开放平台合作企业、产品用户、开发者等代表共同宣布打造“MiniMax Link创新生态圈”,推动AI产业协同创新,让AI与日常生活“连接”的愿景图变成实景图。