Hack VC:项目TGE的十大建议
新模型Vidu直逼Sora,生数科技:还说“中国sora”就太没想象力了
文章来源:硅星GenAI
作者|周一笑,丸丸柚贝
编辑|王兆洋
可媲美Sora的中国文生视频模型,就这么来了。
4月27日上午,在2024中关村论坛上,生数科技联合清华大学发布中国首个长时长、高一致性、高动态性视频大模型——Vidu,它所展示的效果立刻刷屏。
据生数科技,Vidu支持一键生成16秒、1080P分辨率的视频内容。而从视频来看,Vidu的一致性、运动幅度都达到了Sora水准,虽然时长还比不上Sora的最长60秒,但整体上已经可以对标Sora。
生数的发布一如既往的低调,并没有什么发布会。但效果引发广泛关注,一时间“中国Sora”的称谓四起。
但我们第一时间和生数做了交流,这家核心团队来自清华人工智能研究院、由清华人工智能研究院副院长朱军博士牵头的公司对我们表示:
Vidu的视频时长会继续突破,“另外,我们的架构是支持多模态的,视频模态只是当前阶段最重要的。”据生数透露,Vidu目前正在加速迭代提升,面向未来,Vidu灵活的模型架构也将能够兼容更广泛的多模态能力。
言下之意,还说生数科技是“中国sora”,就有点太没想象力了。
生数的野心比这更大。
逐帧拆解对比Vidu与Sora
在今年3月12日的一次交流中,生数科技联合创始人兼CEO唐家渝曾对我们表示:
“今年内一定能达到Sora目前版本的效果,但很难说是三个月还是半年”。
据我们了解,生数三月份就实现了8秒的视频生成,在四月份突破了16秒生成。今天的发布背后,短短两个月时间完成巨大进步。
这次的展示中,到底有哪些细节值得关注,我们第一时间逐帧对比了Vidu与Sora,话不多说,先来一起看一下。
经典走路名场面
Sora这个街头美女走路的视频也是刷爆的各大社交媒体,Vidu一出来就贴脸开大!不光生成街头美女走路,街头帅哥走路就连街头熊都给整出来了!
首先从人物、背景来看,Vidu的生成效果真的和Sora不相上下,但是人物动作协调性与Sora相比还是稍弱一些。
行驶中的越野车
越野车在丛林小道中穿梭,Vidu的丛林背景略有3D动画的效果,更像游戏中的一些场景,Sora的背景更具真实性一些。
中国龙
这一视频场景,二者生成的风格不太相同,Vidu展示的是现实中虚拟龙的形象,Sora是现实中舞龙舞狮真实存在的场景,但是二者对于龙的形象各种细节也都展现出了各自的特点。
另外,除了主体龙之外的背景两者都很真实,但是Sora的视频画面丰富度更高。
人物眼睛特写
这谁能分得清是真实拍摄还是AI生成啊!这一局我感觉Vidu真的不输Sora!
电视合集
Vidu确实是不怕对比的!这个画面丰富度和运镜真是一点不比Sora差。
狗狗
Sora生成的狗狗动态感、真实感更强一些,但是Vidu对狗狗游泳腿上的毛漂浮的细节处理的也相当不错。
猫和人