全球AI音乐会，第一次听见中国声音

2024.04.19

盛夏将至，各条AI赛道也热烈了起来。如果评选一下，近段时间哪个领域的AI应用最为火爆，那么AI音乐创作绝对名列前茅。

一个月之前，海外初创企业Suno发布新版AI音乐生成大模型Suno V3，它可以根据用户自然语言快速生成相关风格音乐，在全球范围内引发热议。而就在不久前，来自前DeepMind团队成员的Udio音乐大模型发布。这款模型可以带来非常逼真的音乐制作效果，并且可以完成多段式、长音乐作品的生成。

AI音乐生成大模型赛道，竞争突然激烈了起来。加上OpenAI的MuseNet、谷歌的MusicLM、Meta的MusicGen等项目，我们似乎在今年迎来了一场全球AI音乐会。一时间异彩纷呈，好不热闹。

但在这场AI音乐会中，有一个现象非常值得重视：这一次，中国科技与全球前沿AI趋势之间没有时差，无缝衔接。我们不再是跟随者与追赶者，而是第一时间加入了这场音乐与AI的盛宴，奏响了属于自己的旋律。

4月2日，由昆仑万维打造的AI音乐生成大模型“天工SkyMusic”开启免费邀测，4月17日更是正式发布。

天工SkyMusic是国内唯一公开可用的AI音乐生成大模型，也是中国首个音乐SOTA模型。

它与震撼全球科技与音乐产业的Suno、Udio保持了时间线上的高度同步，同时多个领域的技术能力更加出色。在与Suno V3的横向测评中，天工SkyMusic在人声&BGM音质、人声自然度、发音可懂度等领域显著领先对手，并以6.65分的综合得分超越Suno V3，成为全球AI音乐最新SOTA模型。

“中国AI不缺席”，是一段我们期待了很久的旋律。究竟是什么让昆仑万维能够完成这次演奏？天工SkyMusic，以及背后的天工3.0有着怎样的产业与社会价值？

让我们打开这场全球AI音乐会，听懂一首关于“中国AI不缺席”的盛夏奏鸣曲。

天工SkyMusic：东方的AI音乐会

不缺席的中国AI音乐大模型，不仅需要第一时间跻身行业一线，更需要在能力上拿出足够有说服力的答案。

天工SkyMusic在发布之后，获得了各方非常积极的反馈。来自媒体、音乐人与行业专家以及广大用户的声音，证明了其具备加入全球AI音乐大模型竞逐的底气。AI音乐会不仅发生在欧美，同时也奏响在东方。

首先，我们可以具体来看一下天工SkyMusic在技术能力上的特色。

通过采用音乐音频领域类Sora的DiT模型架构，天工SkyMusic在AI音乐大模型的几个核心能力指标上都有不俗的表现。

其中包括高质量的音乐生成能力、高逼真的人声模拟能力、高丰富度的歌词段落控制能力、高规模的音乐风格掌握，以及高灵活的音乐表达。

举例而言，欧美AI音乐风格多以“器”见长，更偏重乐器丰富度参数，但在人声拟合方面往往表现一般。

相较而言，昆仑万维天工SkyMusic则专门在人声自然度、发音可懂度上进行了模型专门训练，使得AI发音清晰、无异响，让大模型生成的音乐足以“以假乱真”。

此外，天工SkyMusic所能够创作的音乐，展现出了对多种不同音乐风格，不同生成诉求的把握。比如神曲改造对流行音乐的把握，古诗词改编对中国传统文化与格律的把握等。

透过广泛的生成案例，我们可以发现天工SkyMusic具有丰富的使用场景与广泛的需求人群，例如：

1.音乐从业者可以借助天工SkyMusic寻找灵感，辅助音乐创作。比如说，创作者可以输入一些“母题”，包括亲情、爱情等。通过天工SkyMusic生成的歌词与旋律来寻找灵感，探索创作边界。

2.短视频创作者和UP主可以通过音乐生成来拓展创作边界，降低音乐方案的创作门槛。比如说，UP主可以用天工SkyMusic改编“网络神曲”，获得新的视频BGM。下面这首神曲，天工SkyMusic就可以为你带来完全不一样的感受。

3.音乐爱好者与粉丝可以获得更多样的音乐乐趣，与自己喜欢的音乐类型、音乐风格进行更加多样性、深层次的互动。比如我们可以换一个声音，把我们喜欢的音乐进行重新演绎。

4.在教育教学场景中，天工SkyMusic可以用来辅助音乐教育，让学习者感受到音乐创作的内在逻辑与丰富技巧。同时还能够助力传统文化、乐器演奏等方面的教育教学。比如说，天工SkyMusic可以基于古诗词生成音乐，让学生更生动准确掌握古典文化的精髓。

相关推荐