AI 音乐，会不会诞生下一个「抖音」？

2024.04.24

文章来源：极客公园

图片来源：由无界AI生成

音乐创作从此触手可及。

作者 | 连冉
编辑 | 郑玄

AI 音乐最近火到发烫。

首先是三月下旬，美国 AI 初创公司 Suno 发布 V3 音乐生成模型，该模型能够在几秒钟内根据输入的提示词生成两分钟的高质量音频，惊艳的效果让行业相信 AI 音乐已经迎来了自己的「ChatGPT 时刻」。

紧接着，一个月后，国内的昆仑万维宣布推出「天工SkyMusic」音乐生成大模型，其评分超越 Suno V3，成为 AI 音乐生成模型最新 SOTA（State of the Art，指当前技术在本领域技术指标全球第一）。

这引起了极客公园的好奇。客观来说，今天中美在 AI 大模型的基础研发上还存在着一定差距。即使细分领域的垂直模型，如此自信地宣称全球领先的团队并不多见。

此外，音乐作为多模态领域中的重要组成部分，有着不菲的产业价值。全球录制音乐市场一年的总收入近 300 亿美元，而相关的演唱会、BGM、KTV 和线上的短视频、K 歌平台等更是每年数千亿美元的市场规模。AI 的介入必然带来生产侧和消费侧的全面革新，其潜在影响不会亚于数字音乐和流媒体的兴起。

因此在 4 月 17 日「天工SkyMusic」正式上线后，我们第一时间下载并体验了这款软件。以下是我们的体验感受，以及对 AI 音乐未来发展的一点想法。

01/「天工SkyMusic」：
一段歌词，几秒生成
三首不同风格的歌曲

从产品设计角度来看，「天工SkyMusic」与「Suno V3」在多个方面相似，但在一些关键细节上还是有明显的不同。

使用「天工SkyMusic」生成音乐，需要输入歌名、歌词，同时可以通过添加段落信息，比如「主歌」、「副歌」、「前奏」等进行微调——这些都与 Suno 的操作相似。

Suno 界面

天工SkyMusic 界面

两者最大的不同在于：Suno 要求用户输入歌曲风格，如流行、爵士或说唱；而「天工SkyMusic」则允许选择参考曲目，可以来自其他用户上传过的歌曲，也支持自己上传。

这个功能非常有用。一方面，相比于泛泛的「风格」，「曲目」提供了更精确的定向，这更有助于生成自己想要的音乐。

从实际使用体验来看，如果缺少专业乐理训练，普通用户很难精准描述歌曲风格——想象一下，该用什么语言描述《夜的第七章》？因此，像「天工SkyMusic」这样能够在浏览并倾听原音乐时找到与自己歌词契合的风格，这比使用自然语言描述能够更好地表达音乐需求，也更契合普通用户的音乐创作的场景。

输入歌词、歌名和参考曲目以后，就可以直接生成音乐。「天工SkyMusic」会一次性生成三首风格、唱腔略有不同的歌曲——这是一个很实用的产品设计。不论是「Suno V3」还是「天工SkyMusic」，尽管今天 AI 音乐虽然已经能生成出一定水准的音乐，但稳定性还有待提升，三首里往往只有一首还算不错，而想要得到更好的音乐，除了需要做好歌词分段等微调，更需要反复尝试。

除了写好歌词生成歌曲以外，「天工SkyMusic」也支持 AI 写词。如上所示，上面这首《夏天的风》就是我们用「AI 写词」和「生成歌曲」完成创作的歌曲。这首歌的旋律还不错，但由于没有给歌词分段，整首歌听下来缺少了一点音调变化。

我尝试在苏轼的《水调歌头》里加上分段，这次生成的歌曲就有了明显的情感变化，尤其是唱到「人有悲欢离合，月有阴晴圆缺」这样的副歌高潮段落时，感染力十足。

如果生成了满意的歌曲，用户还可以选择「投稿」发布到「天工SkyMusic」平台，以及支持分享到其他社交媒体平台。在首页，我听了一些点赞比较多的热门生成音乐，其中不乏一些质量上乘的作品，乍一听几乎无法辨别其为 AI 生成——当然仔细分辨的话，还是能在一些细节处理上看到与专业作品的差距。

事实上，许多专业音乐人对「天工SkyMusic」也有不低的评价。例如，B 站 UP 主 @Metalion，一名职业音乐人，他尝试了用自己的旧歌词生成，并试听了主页其他人发布的热门 AI 歌曲，其中有好几首都给出了「还不错」、「像是一首完整的歌曲」这种不低的评价。

B 站 UP 主@Metalion 发布的视频 | 来源：B 站截图

AI 音乐，会不会诞生下一个「抖音」？

加⼊OKEx全球社群

相关推荐