复制成功

分享至

主页 > 数字货币 >

2024年,AI视频的下一步是什么?

2024.02.08

文章来源:东西互娱

图片来源:由无界AI生成 图片来源:由无界AI生成

2024开年,视频大模型领域就迎来一系列重量级更新。

谷歌公司在不久前的1月23日重磅推出了Lumiere模型,此前以文生图工具闻名的Midjourney于1月2日正式官宣了该公司在未来几个月训练Text-to-Video模型的计划;Runway的Gen-2模型也迎来了又一次重要的功能更新。

而在国内,过去一个月,字节跳动和腾讯也分别公布了MagicVideo V2与VideoCrafter2。

AI生成视频会如何进化?近期,知名投资机构a16z在其官网发布了《为什么2023是AI视频的突破年,以及2024年的展望》一文,详细分析了AI视频在过去一年的进展,以及现在面临的问题和展望。

下为东西文娱的编译,版权属于原作者。

2023 年是AI视频的兴盛之年。23年初时,市面上还不存在公开的文本生成视频模型。但仅仅12个月后,就有数十种视频生成产品投入使用,全球范围内也有了数以百万计的用户根据文字或图片提示来制作短视频。

相对而言,这些产品仍然具有局限性——大多数只能生成 3 到 4 秒钟的视频,视频质量参差不齐,而人物风格一致性等问题也亟待解决。想凭借单一(或多个)文字提示就制作出皮克斯水平的短片,我们仍有很长的路要走。

不过,过去一年里视频生成技术上取得的进展说明,我们正处于大规模变革的起始阶段——这与图像生成技术的发展存在相似之处。文生视频模型正在不断演化进步,而图像生成视频和视频生成视频等分支也同样在蓬勃发展。

我们跟进了目前为止最重要的发展、值得关注的公司以及该领域尚存的潜在问题,以此来帮助人们理解这一创新上的大爆发。

2024年,AI视频的下一步是什么?


现在的人们能够在哪里生成AI视频?


 产品 

今年,截至本文发布,我们已经跟进了21个公开的AI视频模型。虽然你可能早就听说过Runway、Pika、Genmo以及Stable Video Diffusion,但实际上,你还能在市面上发现更多模型。

2024年,AI视频的下一步是什么?

这些产品大多出自初创公司之手,而其中大多都是从Discord机器人开始的,它们有一些优势:

1.你不需要建立面向消费者的界面,可以专注于模型质量。

2.你可以利用 Discord 每月1.5亿活跃用户的基础进行传播,尤其是你在平台的 “发现”页面上被推荐的话。

3.公共频道能够使新用户通过查看他人作品的方式轻松获得创作灵感,还能为用户的作品提供社交认证。

不过,越来越多的视频产品建立了自己的网站,甚至是移动端APP——尤其在其越发成熟的情况下。虽然Discord为制作团队提供了一个很好的启动平台,但它在纯生成基础上所添加的工作流程有限,制作团队对消费者体验的把握也非常有限。同样值得注意的是,还有很大一部分人不使用 Discord,因此这一部分人可能会觉得界面乱七八糟,或者干脆就不怎么用。

 研究和科技巨头 

然而,谷歌、Meta等等科技巨头去哪里了?尽管你可能已经知道了科技巨头们发表的诸多热度很高的帖子,比如说Meta的Emu Video, 谷歌的VideoPoet和Lumiere,以及字节跳动的MagicVideo,然而他们的模型却根本不在已公开模型的队伍里。

截至目前,除了阿里巴巴以外,其他的科技巨头都仍未公开发布自己的视频生成模型。但是,这些巨头却纷纷以各种各样的形式来发表视频生成的相关论文;同时,他们还在不声明模型是否会发布,或者什么时候发布的前提下对外发布演示版本的视频。

2024年,AI视频的下一步是什么?

这些科技巨头坐拥数十亿用户,拥有巨大的分销优势。但为什么,当他们的演示作品看上去十分成熟,明明有机会可以在这一新兴市场里占据巨大份额时,他们却选择不发布自己的视频生成模型呢?

很重要的一点是,这些巨头的动作往往比较慢。虽然Instagram在去年年底为Stories推出了一款AI背景生成器,而TikTok也在暗中推出AI滤镜,但大部分巨头仍然没有发布文字-图像模型。出于法律、安全以及版权等方面的考虑,这些公司很难将科研成果转化成产品,因此需要推迟产品的发布,这就让行业新人获得了先发制人的机会。

AI视频的下一步是什么?


免责声明:数字资产交易涉及重大风险,本资料不应作为投资决策依据,亦不应被解释为从事投资交易的建议。请确保充分了解所涉及的风险并谨慎投资。OKEx学院仅提供信息参考,不构成任何投资建议,用户一切投资行为与本站无关。

加⼊OKEx全球社群

和全球数字资产投资者交流讨论

扫码加入OKEx社群

相关推荐

industry-frontier