Geometry Capital HK获批香港证
新融资 1.25 亿,用户超 1000 万,Suno 打算如何「改造」音乐行业?
文章来源:Founder Park
昨天,Suno 在 X 上宣布成功完成了 1.25 亿美元的 B 轮融资。本轮投资者中,有风险投资公司 Lightspeed Venture Partners,还包括风险投资基金 Founders Collective,以及科技高管和投资者 Nat Friedman。
根据 The Information 的消息来源,本轮融资后 Suno 估值达到 5 亿美元。新筹集的资金将用于扩大公司的员工队伍,截至今年早些时候,公司仅有 12 名员工。
自 8 个月前推出首款产品以来,Suno AI 的用户群体已迅速增长至超过 1000 万。微软公司更是将 Suno 的功能直接整合到了其 Copilot 产品中。
在 Suno 的歌曲排行榜中 ,Stone 是第一首超过 100 万次收听的歌曲。如果 AI 音乐在开发一两年后就能如此流行,难以想象一下五年后它变成什么样。
最近,知名科技博主 No Priors 邀请到了 Suno 的联合创始人兼首席执行官 Mikey Schulman 展开一场精彩的讨论。在访谈中,Mikey 分享了与他人合作创办 Suno 的心路历程,AI 音乐的难点以及它未来将会如何引爆产业变革。
文章基于 No Priors 对 Mikey Schulman 的访谈编译,Founder Park 略有增删。
01
从物理学到 AIGC:
一切源于热爱?
Sarah:作为一位音乐爱好者,你的转型之旅相当独特,从音乐领域跨越到哈佛物理学博士,再到创立数家人工智能企业,能否跟我们分享一下这段历程?
Mikey:确实,这是一条曲折的路。我玩音乐已经有很长时间了,四岁起学习钢琴,成长过程中参与了很多乐队。然而,我意识到虽然我热爱音乐,但我的专长并不在此。相比之下,物理是更为明智的选择。我一路求学,从大学到研究生,直到取得物理学博士学位,专注于量子计算的研究。然而,尽管量子计算魅力无限,我内心清楚,它并不是我的终身事业。
Sarah:你是否预想过自己会成为一位理论物理学家?
Mikey:我从来没有设定过固定的职业路径,从不限定自己要做什么或不做什么。在研究生期间,我接触到的量子力学研究不仅理论深奥,而且在实践层面极具挑战。这一领域在上世纪 50 年代奠定基础,其中包含许多复杂的低温微波工程挑战,这些对于实际应用至关重要,我发现自己在处理这些问题上比一般的物理学家更有天赋。我在这里找到了自己的优势,享受着每一个探索的瞬间。
Sarah: 能否谈谈你是如何从物理学术界转向创业的?
Mikey: 我的转折点始于偶然遇见一家名为 Kentro 的小公司,它只有大约 10 名成员,但我立刻被那里的人和氛围吸引了。于是,我决定加入他们,成为一名软件工程师。幸运的是,我入职之后机器学习的机遇便显现出来,尤其是在 2014 年,有物理学博士学位的我恰好成为了这一新兴领域中的一员。我抓住这个机会,快速学习,组建团队,开发出一些有趣的产品,最终在 2018 年,我们的公司被 S&P Global 收购。
Sarah:你们的起点是基于一个开源模型——Bark。能否分享一下你们最初的灵感来源,以及你们是如何进入音乐生成这片领域的呢?
Mikey:在 Kensho,我们专注于文本处理,直到被 S&P Global 收购后,我们接手了首个音频相关的项目——将收益电话会议转录为文字。你们两位都阅读过的收益电话会议记录,有很大一部分就是 S&P Global 的成果。以往这类工作全靠人工,不仅繁琐而且费时,但通过自动化,我们显著提升了效率和处理量,也因此对音频 AI 产生了浓厚的兴趣。虽然我们本身就是音乐爱好者,但恰恰是这样一个并不那么吸引人的项目——收益电话会议的音频转录,点燃了我们的热情。此外,我们观察到相比于图像和文本领域,音频处理技术的发展滞后许多,这一情况在 2020 年尤为明显,而近年来图像和文本技术的飞速发展更是加剧了这一差距。
像我之前提到的,我们并没有一个详尽的长远规划。在开源项目 Bark 的开发过程中,甚至在它发布之前,我们就已经确定语音不是我们的主攻方向。确实,有不少人建议我们投身语音技术领域,他们认为开一个语音公司会更直接,「你会构建一个伟大的 B2B 产品,人们会喜欢它」。但我们太喜欢音乐了。所以我们决定建立一个音乐公司。
02
新一轮产业变革:
既是消费者,也是创作者
Sarah:为何你们决定不专注于语音而是投身音乐?