复制成功

分享至

主页 > 数字货币 >

AI王炸?字节版MJ和Sora,实力几何?丨AI 内测

2024.04.16

文章来源:AI鲸选社

AI王炸?字节版MJ和Sora,实力几何?丨AI 内测


众多周知,字节跳动在All in AI。毕竟2023年净利润3000亿(字节否认了),要为自己准备下一阶段的发展动力。

此前鲸选盘点过字节推出的很多AI 产品,大多是AI对话类。在文生图和文生视频领域,字节目前似乎在倾力打造Dreamina,这款AI产品对标国外的Midjourney和Sora,难度不小。

最近Dreamina在放内测资格,到底哥为你带来一手测评。

AI王炸?字节版MJ和Sora,实力几何?丨AI 内测

 文生图片能力,还有努力的空间

文生图片很多时候不仅考验生成视频的精细度,也考验对文字的理解能力,我们就做一个“耳朵是蝴蝶翅膀的大象”。

从生成结果看,完全没有体现出来文字想要表达的创意。

AI王炸?字节版MJ和Sora,实力几何?丨AI 内测


我们看到有上传参考图的功能,所以上传了这张比较有名的创意图。

AI王炸?字节版MJ和Sora,实力几何?丨AI 内测


我们选择了主要参考点是主体,Dreamina识别出了这张图的主体是大象。

AI王炸?字节版MJ和Sora,实力几何?丨AI 内测


我们在选择写实风格,有了参照图后,生成的图片终于理解了文字的意思, 不过这图片,怎么感觉像抠图后加上背景生成的呢?

AI王炸?字节版MJ和Sora,实力几何?丨AI 内测

文生视频能力,不是Sora路线

我们先看看Dreamina社区中,一些文生视频的案例。

AI王炸?字节版MJ和Sora,实力几何?丨AI 内测


是不是还挺酷炫,要知道Sora生成水杯破裂的视频,是不能够了解破裂过程应该如何呈现,而Dreamina这个视频,则是理解了物理规律,还加上了想象力的翅膀。

到底哥以为文生视频能力会很酷炫,直到我看到了它的参考图。


AI王炸?字节版MJ和Sora,实力几何?丨AI 内测


我瞬间意识到,Dreamina应该和Pika等AI视频的路线相似,就是图片关键帧动起来,所以并不是对文字的真正理解,以及视频画面的原生,而是几秒钟的关键帧运动。

所以我们接着拿蝴蝶大象做生成测试,没有意外,视频也没有体现文字的意思,还是一只大象动了几秒钟。


AI王炸?字节版MJ和Sora,实力几何?丨AI 内测


一位同样从事Sora产品跨国开发的负责人,告诉AI鲸选社,这是Dreamina跨域和泛化问题还没处理好。

虽然Dreamina还存在一些问题,但其从头研发,并且比Sora更早开放测试,证明其还是有决心和潜力做更好,期待其迭代版本。

免责声明:数字资产交易涉及重大风险,本资料不应作为投资决策依据,亦不应被解释为从事投资交易的建议。请确保充分了解所涉及的风险并谨慎投资。OKEx学院仅提供信息参考,不构成任何投资建议,用户一切投资行为与本站无关。

加⼊OKEx全球社群

和全球数字资产投资者交流讨论

扫码加入OKEx社群

相关推荐

industry-frontier