AI王炸？字节版MJ和Sora，实力几何？丨AI 内测

2024.04.16

文章来源：AI鲸选社

众多周知，字节跳动在All in AI。毕竟2023年净利润3000亿（字节否认了），要为自己准备下一阶段的发展动力。

此前鲸选盘点过字节推出的很多AI 产品，大多是AI对话类。在文生图和文生视频领域，字节目前似乎在倾力打造Dreamina，这款AI产品对标国外的Midjourney和Sora，难度不小。

最近Dreamina在放内测资格，到底哥为你带来一手测评。

文生图片很多时候不仅考验生成视频的精细度，也考验对文字的理解能力，我们就做一个“耳朵是蝴蝶翅膀的大象”。

从生成结果看，完全没有体现出来文字想要表达的创意。

我们看到有上传参考图的功能，所以上传了这张比较有名的创意图。

我们选择了主要参考点是主体，Dreamina识别出了这张图的主体是大象。

我们在选择写实风格，有了参照图后，生成的图片终于理解了文字的意思，不过这图片，怎么感觉像抠图后加上背景生成的呢？

我们先看看Dreamina社区中，一些文生视频的案例。

是不是还挺酷炫，要知道Sora生成水杯破裂的视频，是不能够了解破裂过程应该如何呈现，而Dreamina这个视频，则是理解了物理规律，还加上了想象力的翅膀。

到底哥以为文生视频能力会很酷炫，直到我看到了它的参考图。

我瞬间意识到，Dreamina应该和Pika等AI视频的路线相似，就是图片关键帧动起来，所以并不是对文字的真正理解，以及视频画面的原生，而是几秒钟的关键帧运动。

所以我们接着拿蝴蝶大象做生成测试，没有意外，视频也没有体现文字的意思，还是一只大象动了几秒钟。

一位同样从事Sora产品跨国开发的负责人，告诉AI鲸选社，这是Dreamina跨域和泛化问题还没处理好。

虽然Dreamina还存在一些问题，但其从头研发，并且比Sora更早开放测试，证明其还是有决心和潜力做更好，期待其迭代版本。

相关推荐