为什么说比特币生态必将
撕开“美女创始人”“富二代”网红标签 探究Pika被资本追逐的本质
原文来源:元宇宙新声
图片来源:由无界 AI生成
如果现在还不知道Pika Labs,那么你可能就已经OUT了。因为,这家仅成立半年的AI初创公司已经成为硅谷资本的“新宠”。
我们看到,在Pika Labs背后的投资人阵容堪称豪华,比如OpenAI两位创始成员Adam D'Angelo、Andrej Karpathy,前Github CEO Nat Friedman,HuggingFace创始人Clem Delange,Giphy联合创始人Alex Chung,YC合伙人Daniel Gross等,要知道,这几乎是硅谷AI行业的半壁江山。
其实,Pika Labs的走红并不让人意外,这家公司身上贴满了“富二代”、“美女创始人”、“学霸创业”等一个比一个吸引眼球的“标签”。但这些网红般的“标签”是Pika Labs成功的秘诀吗?
成立半年,公司仅四人,却引爆硅谷
在谈论Pika Labs的时候,绕不开95后女孩郭文景。
资料显示,郭文景母亲是麻省理工毕业高材生,而父亲则是浙江首家在国内主板上市的软件公司信雅达科技实控人郭华强,显然,郭文景手拿的是妥妥“富二代”剧本。
但在这样背景下,也掩盖不住郭文景资历的强悍,她是浙江当届第一个被哈佛本科提前录取的学生,进入哈佛后,郭文景一边攻读学业,一边去Meta、微软、谷歌大脑、Epic Games等公司实习,在拿到计算机硕士和数学本科学位后,她又来到斯坦福大学读博。
而正是到斯坦福大学读博的经历,让郭文景遇到了之后与他一起创业的孟晨琳(Chenlin Meng),今年4月,两人双双从斯坦福大学退学创业成立了Pika labs,仅仅在半年后,Pika labs就震惊了全世界。
Pika labs创始人郭文景(左)和联合创始人兼CTO孟晨琳。
11月29日,Pika labs官宣了最新的视频生成模型Pika1.0,Pika1.0能够生成和编辑3D动画、动漫、卡通和电影。几乎不需要任何门槛,用户只需要输入一句话,就可以生成想要的各种风格的视频。
在宣传片中,Pika1.0拥有强大的语义理解能力,输入“马斯克穿着太空服,3D动画”的关键词,一个身穿太空服的卡通马斯克便出现了,身后还有SpaceX的火箭。文生视频的清晰度和连贯性,远超市面上其他AI视频生成产品。正是这个宣传片让Pika“点燃”了硅谷。
(宣传片动图)
其实在11月3日,Pika labs就出现在了大众面前。在《流浪地球3》的发布会上,工业化实验室G!Lab官宣成立,战略合作伙伴包括华为、小米、商汤等,共同探索用AI技术打造电影工业化3.0。而战略合作伙伴名单中,紧挨商汤,第二排居中的就是Pika Labs。消息称,郭帆导演10月从美国考察回来后,称赞Pika对AI视频的研究非常超前。
至今,Pika labs已经完成了三轮融资,总金额5500万美元,估值超10亿元人民币。
Pika labs的走红,代表着时下日新月异的AIGC市场再次泛出了新鲜的涟漪。与此同时,很多人发出疑问,为什么这家仅成立半年、仅四人的公司能被资本热捧呢?
拨开“明星”外衣,AI生成视频价值几何?
在今年ChatGPT掀起的人工智能大模型热潮中,基于语言大模型的聊天机器人成为最热门创业方向;而在泛内容生成类AI应用中,图像生成是最主要的场景,其次是写作工具、视频生成工具。
相较于语言模型,AI生成视频是完全不同的一类模型。其与AI生成图片的模型有共通之处,但难度更高。
郭文景在接受媒体采访时表示,视频有很多与图片不一样的问题,比如要确保视频的流畅性、确保动作,视频比图像更大,需要更大的GPU内存,视频生成需要考虑逻辑问题,还要考虑如何生成,是一帧一帧生成的,还是一起生成的,现在很多模型是一起生成,生成的视频就很短。
孟晨琳补充,视频的每一帧都是一张图片,比生成图片困难得多。因为每一帧的生成质量要高,相邻帧之间还要有关联性。当视频很长时,确保每一帧都协调一致是个相当复杂的问题。
在训练时,处理视频数据时要处理多张图片,模型需要适应这种情况。比如,如何将100帧图片传输到GPU上是一个挑战。而在推理时,由于涉及生成大量帧,推理速度相对于单张图片会更慢,计算成本也会增加。
另外,控制视频生成更难,因为模型需要生成每一帧发生的事情,而用户不会希望为每一帧都提供详细的描述。