星球日报 | Avail公布空投细
全球AI音乐会,第一次听见中国声音
盛夏将至,各条AI赛道也热烈了起来。如果评选一下,近段时间哪个领域的AI应用最为火爆,那么AI音乐创作绝对名列前茅。
一个月之前,海外初创企业Suno发布新版AI音乐生成大模型Suno V3,它可以根据用户自然语言快速生成相关风格音乐,在全球范围内引发热议。而就在不久前,来自前DeepMind团队成员的Udio音乐大模型发布。这款模型可以带来非常逼真的音乐制作效果,并且可以完成多段式、长音乐作品的生成。
AI音乐生成大模型赛道,竞争突然激烈了起来。加上OpenAI的MuseNet、谷歌的MusicLM、Meta的MusicGen等项目,我们似乎在今年迎来了一场全球AI音乐会。一时间异彩纷呈,好不热闹。
但在这场AI音乐会中,有一个现象非常值得重视:这一次,中国科技与全球前沿AI趋势之间没有时差,无缝衔接。我们不再是跟随者与追赶者,而是第一时间加入了这场音乐与AI的盛宴,奏响了属于自己的旋律。
4月2日,由昆仑万维打造的AI音乐生成大模型“天工SkyMusic”开启免费邀测,4月17日更是正式发布。
天工SkyMusic是国内唯一公开可用的AI音乐生成大模型,也是中国首个音乐SOTA模型。
它与震撼全球科技与音乐产业的Suno、Udio保持了时间线上的高度同步,同时多个领域的技术能力更加出色。在与Suno V3的横向测评中,天工SkyMusic在人声&BGM音质、人声自然度、发音可懂度等领域显著领先对手,并以6.65分的综合得分超越Suno V3,成为全球AI音乐最新SOTA模型。
“中国AI不缺席”,是一段我们期待了很久的旋律。究竟是什么让昆仑万维能够完成这次演奏?天工SkyMusic,以及背后的天工3.0有着怎样的产业与社会价值?
让我们打开这场全球AI音乐会,听懂一首关于“中国AI不缺席”的盛夏奏鸣曲。
天工SkyMusic:东方的AI音乐会
不缺席的中国AI音乐大模型,不仅需要第一时间跻身行业一线,更需要在能力上拿出足够有说服力的答案。
天工SkyMusic在发布之后,获得了各方非常积极的反馈。来自媒体、音乐人与行业专家以及广大用户的声音,证明了其具备加入全球AI音乐大模型竞逐的底气。AI音乐会不仅发生在欧美,同时也奏响在东方。
首先,我们可以具体来看一下天工SkyMusic在技术能力上的特色。
通过采用音乐音频领域类Sora的DiT模型架构,天工SkyMusic在AI音乐大模型的几个核心能力指标上都有不俗的表现。
其中包括高质量的音乐生成能力、高逼真的人声模拟能力、高丰富度的歌词段落控制能力、高规模的音乐风格掌握,以及高灵活的音乐表达。
举例而言,欧美AI音乐风格多以“器”见长,更偏重乐器丰富度参数,但在人声拟合方面往往表现一般。
相较而言,昆仑万维天工SkyMusic则专门在人声自然度、发音可懂度上进行了模型专门训练,使得AI发音清晰、无异响,让大模型生成的音乐足以“以假乱真”。
此外,天工SkyMusic所能够创作的音乐,展现出了对多种不同音乐风格,不同生成诉求的把握。比如神曲改造对流行音乐的把握,古诗词改编对中国传统文化与格律的把握等。
透过广泛的生成案例,我们可以发现天工SkyMusic具有丰富的使用场景与广泛的需求人群,例如:
1.音乐从业者可以借助天工SkyMusic寻找灵感,辅助音乐创作。比如说,创作者可以输入一些“母题”,包括亲情、爱情等。通过天工SkyMusic生成的歌词与旋律来寻找灵感,探索创作边界。
2.短视频创作者和UP主可以通过音乐生成来拓展创作边界,降低音乐方案的创作门槛。比如说,UP主可以用天工SkyMusic改编“网络神曲”,获得新的视频BGM。下面这首神曲,天工SkyMusic就可以为你带来完全不一样的感受。
3.音乐爱好者与粉丝可以获得更多样的音乐乐趣,与自己喜欢的音乐类型、音乐风格进行更加多样性、深层次的互动。比如我们可以换一个声音,把我们喜欢的音乐进行重新演绎。
4.在教育教学场景中,天工SkyMusic可以用来辅助音乐教育,让学习者感受到音乐创作的内在逻辑与丰富技巧。同时还能够助力传统文化、乐器演奏等方面的教育教学。比如说,天工SkyMusic可以基于古诗词生成音乐,让学生更生动准确掌握古典文化的精髓。