新模型Vidu直逼Sora，生数科技：还说“中国sora”就太没想象力了

2024.04.28

文章来源：硅星GenAI

作者｜周一笑，丸丸柚贝

编辑｜王兆洋

图片来源：由无界AI生成

可媲美Sora的中国文生视频模型，就这么来了。

4月27日上午，在2024中关村论坛上，生数科技联合清华大学发布中国首个长时长、高一致性、高动态性视频大模型——Vidu，它所展示的效果立刻刷屏。

据生数科技，Vidu支持一键生成16秒、1080P分辨率的视频内容。而从视频来看，Vidu的一致性、运动幅度都达到了Sora水准，虽然时长还比不上Sora的最长60秒，但整体上已经可以对标Sora。

生数的发布一如既往的低调，并没有什么发布会。但效果引发广泛关注，一时间“中国Sora”的称谓四起。

但我们第一时间和生数做了交流，这家核心团队来自清华人工智能研究院、由清华人工智能研究院副院长朱军博士牵头的公司对我们表示：

Vidu的视频时长会继续突破，“另外，我们的架构是支持多模态的，视频模态只是当前阶段最重要的。”据生数透露，Vidu目前正在加速迭代提升，面向未来，Vidu灵活的模型架构也将能够兼容更广泛的多模态能力。

言下之意，还说生数科技是“中国sora”，就有点太没想象力了。

生数的野心比这更大。

逐帧拆解对比Vidu与Sora

在今年3月12日的一次交流中，生数科技联合创始人兼CEO唐家渝曾对我们表示：

“今年内一定能达到Sora目前版本的效果，但很难说是三个月还是半年”。

据我们了解，生数三月份就实现了8秒的视频生成，在四月份突破了16秒生成。今天的发布背后，短短两个月时间完成巨大进步。

这次的展示中，到底有哪些细节值得关注，我们第一时间逐帧对比了Vidu与Sora，话不多说，先来一起看一下。

经典走路名场面

Sora这个街头美女走路的视频也是刷爆的各大社交媒体，Vidu一出来就贴脸开大！不光生成街头美女走路，街头帅哥走路就连街头熊都给整出来了！

首先从人物、背景来看，Vidu的生成效果真的和Sora不相上下，但是人物动作协调性与Sora相比还是稍弱一些。

Vidu

Sora

行驶中的越野车

越野车在丛林小道中穿梭，Vidu的丛林背景略有3D动画的效果，更像游戏中的一些场景，Sora的背景更具真实性一些。

Vidu

Sora

中国龙

这一视频场景，二者生成的风格不太相同，Vidu展示的是现实中虚拟龙的形象，Sora是现实中舞龙舞狮真实存在的场景，但是二者对于龙的形象各种细节也都展现出了各自的特点。

另外，除了主体龙之外的背景两者都很真实，但是Sora的视频画面丰富度更高。

Vidu

Sora

人物眼睛特写

这谁能分得清是真实拍摄还是AI生成啊！这一局我感觉Vidu真的不输Sora！

Vidu

Sora

电视合集

Vidu确实是不怕对比的！这个画面丰富度和运镜真是一点不比Sora差。

Vidu

Sora

狗狗

Sora生成的狗狗动态感、真实感更强一些，但是Vidu对狗狗游泳腿上的毛漂浮的细节处理的也相当不错。

Vidu

Sora

猫和人

新模型Vidu直逼Sora，生数科技：还说“中国sora”就太没想象力了

逐帧拆解对比Vidu与Sora

经典走路名场面

行驶中的越野车

中国龙

人物眼睛特写

电视合集

狗狗

加⼊OKEx全球社群

相关推荐