复制成功

分享至

主页 > 数字货币 >

Sora发布后,Pika创始人回应:很振奋,我们将直接冲

2024.02.18

文章来源:钛媒体

作者:李程程

图片来源:由无界AI生成 图片来源:由无界AI生成

OpenAI刚刚推出的Sora像是一颗炸弹,再一次引爆全球。

作为AI视频模型,Sora可以根据文本指令创建现实且富有想象力的场景,能够生成具有多个角色、特定类型的运动,以及主体和背景的准确细节的复杂场景的高清视频,并且时长可以达到一分钟。

Sora对语言的理解也达到了一个新的层级,使其能够准确地理解提示词,并生成表达充满活力的情感的视频。它建立在过去对DALL·E和GPT模型的综合研究之上,提出了一种新的模型可能。它不仅可以理解用户在提示中提出的要求,还能理解它们在物理世界中的存在方式。

重要的是,Sora是一个diffusion transformer,而transformers已经在语言建模、计算机视觉和图像生成等各大领域已经表现出了杰出的扩展特性。

作为一种扩散模型(diffusion models),Sora除了能够根据文本指令生成视频之外,还能够获取现有的静态图像并从中生成视频,准确地动画图像的内容并关注小细节。Sora还可以获取现有视频并对其进行扩展或填充缺失的画面。

Sora发布后,Pika创始人回应:很振奋,我们将直接冲

Sora从大型语言模型中获得灵感,这些模型通过互联网规模数据的训练来获得通用能力。(截图来自OpenAI发布的Sora技术研究报告:Video generation models as world simulators)

OpenAI发布的技术报告认为,Sora的研究结果表明,扩展视频生成模型是构建物理世界通用模拟器一条极具前景的途径。它使人工智能理解和模拟运动中的物理世界,迈向了一个新的高度。

因此,Sora也被认为是AGI实现过程里的重大里程碑事件,而不仅仅只是视频生成。

在Sora发布之前,Runway和Pika都被认为是视频生成赛道的佼佼者。Sora发布之后,很多人认为,它凭一己之力已经轻松“吊打”且即将“干翻”这两家新兴独角兽公司,并对创业者的命运表示担忧。

然而,他们自己对此却似乎兴奋更多于恐惧。Pika创始人郭文景独家回应钛媒体App称,“我们觉得这是一个很振奋人心的消息,我们已经在筹备直接冲,将直接对标Sora。”

此外,郭文景还透露,目前已经在招人了,具体计划暂时还不能对外透露。

Pika Labs成立于2023年4月,同年11月发布首个产品Pika 1.0。Pika1.0能够生成和编辑3D动画、动漫、卡通和电影,并且普通用户还可以对其进行加工,被视为一款零门槛“视频生成神器”。

在与钛媒体创始人赵何娟的【AI新生代】系列对话中,郭文景也曾提到,目前生成式视频发展的一个重要限制是算法的成熟度,这也是Pika的核心主攻方向。

“我觉得视频跟语言模型不太一样,关于语言模型大家已经知道大概的方法,算法其实已经比较成熟了。但视频现在没有很好的算法,它不是一个规模化的问题,不是说现在大家的GPU不够多,很多时候其实是算法上还没有很好的一个思路。”郭文景说。

而此次Sora的发布,也给行业提供了一个非常好的算法思路,可能反倒为Pika这样的领先创业公司提供更成熟算法路线可能。

事实上,面对实力强劲的OpenAI,郭文景也早已做好了准备。早在数月前,赵何娟也曾问过郭文景,在视频生成赛道上最关心的对手是谁,郭文景当时即表示,应该是OpenAI。

作为一个在东亚文化里成长的女生,郭文景大学本科毕业于哈佛,而斯坦福博士尚未毕业就辍学创业。其创立的Pika 1.0版本的demo视频流出之后,即一鸣惊人,它能够生成和编辑包括3D动画、动漫、卡通或者电影风格的视频,并且使用起来也很容易上手。

它还允许用户自己上传视频片段,并使用生成式AI来编辑和重新构建场景。电影质感,动画级特效,Pika 1.0的视觉效果十分炸裂,似乎让普通人都能成为电影导演,即将成为一种可能。

这支最初由4个人组建pika_labs,融资超过5500万美元,几乎所有AI领域的知名早期投资公司都参与了此轮融资。

而就在Pika1.0发布才过去四个月不到,同赛道的Sora的横空出世,在AI视频生成这条路上,又增加了很多变数和可能性。

以下是之前钛媒体创始人赵何娟与Pika创始人郭文景的【AI新生代】对话实录:


当电影梦叠加AI的“魔法”

赵何娟:Hello,Demi,很高兴又见面了,很高兴你能够来到我的直播间,与我们一起来探讨这一波AI浪潮下新生代崛起的话题。作为硅谷最近非常火热的AI生成式视频项目Pika的创始人,外界对你们的讨论也特别多。我想大家应该都会对你的创业,对你本人都会很感兴趣。
我们可不可以先从你自己的经历开始聊一聊,你是怎么从哈佛大学读本科,然后到斯坦福大学读的硕博的?又怎么选择了文本生成视频这个方向来创业的?

免责声明:数字资产交易涉及重大风险,本资料不应作为投资决策依据,亦不应被解释为从事投资交易的建议。请确保充分了解所涉及的风险并谨慎投资。OKEx学院仅提供信息参考,不构成任何投资建议,用户一切投资行为与本站无关。

加⼊OKEx全球社群

和全球数字资产投资者交流讨论

扫码加入OKEx社群

相关推荐

industry-frontier