复制成功

分享至

主页 > 数字货币 >

中国AI今天的问题,是大模型又多又乱

2023.11.21

原文来源:脑极体

中国AI今天的问题,是大模型又多又乱

图片来源:由无界 AI生成

OpenAI的开发者日活动后,GPTs模式引发了新一轮的AI热潮,开发者调用过分火爆,甚至导致OpenAI服务器一度宕机。随后,花式把玩GPTs的经验,以及围绕这种新形态的巨大争议开始涌现。中国的IT从业者、软件开发者与AI工程师也积极参与讨论,迎来了一场新的AI狂欢。

中国AI今天的问题,是大模型又多又乱

但在这种氛围下,却有一种沉默显得像个显眼包。那就是绝大多数大模型公司,似乎都沉默了。为了模仿类GPT的大模型,中国AI圈用了一年时间,雨后春笋般打造了上百个大模型。但其中能够诞生明星应用,能够推动产品创新,甚至能够拥有规模化用户的似乎都寥寥无几。当OpenAI的飞轮效应显现,这些大模型公司就有种越是模仿差距越大的感觉。于是干脆不去追新的热点,埋头把眼前能做的先做完。

记得今年年初的时候,社交网络和媒体都在讨论中国能否有大模型?

当时我们说过,这其实是个伪命题,因为中国早就有大模型。而在ChatGPT爆火之后,中国AI遇到的问题一定不是大模型太少,而是大模型过剩。

今天,这种问题开始浮现了出来。此刻中国AI行业最大的问题,就是大模型太多,而且还挺乱。


摩肩接踵的大模型


中国到底有多少AI大模型?经过一年的井喷式发展,这已经变成了一笔糊涂账。上半年的时候,答案大概是几十个。时间来到11月,有人说是一百多个,有人说是二百多个。总之,中国此刻必然是全世界拥有大模型最多的国家,远远超过美国。

但是,这一百多个大模型有人用过吗?有人对比、评测过吗?恐怕没有。因为除了几个头部大模型形成了用户规模外,其中大部分存在于开源社区,还有一部分只存在通稿里。

这就像什么呢?其实很多人不知道,根据相关数据,中国有2600万足球人口,同样居世界第一。我们无从考证数据从何而来,反正周围踢足球的人看着是不多,而国足的成绩有目共睹。

为什么会出现这么多大模型呢?

首先是今年大模型赛道好,机会难得。虽然科技板块的VC市场非常低迷,但在其他互联网创投项目普遍失效,虚拟货币被严格限制的情况下,AI大模型成为今年近乎唯一的故事。因此即便热钱不多,但还是集中涌向了大模型创业。

其次,与很多人设想的不同,大模型创业并没有真正意义上的高门槛。一旦以股权、期权等方式吸引到了合适的人才,大模型创业公司过多的费用支出。相比于其他科技领域有产品研发、用户推广、硬件化等烧钱选项,在拥有大量开放数据集、免费工具的情况下,仅仅是训练大模型并没有过高的成本门槛,并且所谓大模型项目,往往一个科研团队就可以支撑,不需要像互联网创业公司搭建较为复杂的业务体系。

此外,还有一种“刷业绩”式的大模型,极大程度增加了大模型数量。这种一般是高校、科研机构相关团队,选报大模型方面课题更容易获得立项。其结项结果发布后,大模型数量就又增加了一个。或者是大型企业上级要求做大模型,于是IT部门会根据开源的模型框架搭建一个出来,即使效果不佳,落地困难,也要进行对内对外宣传。

赛道好、成本低、需要完成任务,这几种动力,导致中国大模型越来越多,且产生效率越来越快。

但问题在于,足球人口规模可能确实很重要,但更重要的是有一支能踢进世界杯的球队。


没有希望的窄赛道


那么有人或许要问了。大模型数量说难道不能成为优势吗?我们靠数量出奇迹,说不定数量一多就能选出拔尖的来?

这恐怕并不现实。因为从种种理由来看,今天庞大的大模型规模,都是不可能持续存在。通稿打造类GPT模型而挤入下一个科技时代的美好想法,已经将AI大模型变成了一条没有希望的窄赛道。

我们可以来正视这样几个问题:

1.大模型的数量多,其实和大模型本质背道而驰。

提起大模型,我们会说它的优点是模型的泛化性、高鲁棒性,继而带来了“智能涌现”效果。我们总是惊叹OpenAI的成绩,就是因为GPT系列始终在深度挖掘模型的泛化性。也就是说,大模型的优势就是一个顶一群,用一个模型代替一堆模型,结果反而出现了数量过剩的大模型,这与大模型初衷南辕北辙,并且浪费了海量的社会资源。

2.大模型是底层技术,底层技术的玩家不可能很多。

免责声明:数字资产交易涉及重大风险,本资料不应作为投资决策依据,亦不应被解释为从事投资交易的建议。请确保充分了解所涉及的风险并谨慎投资。OKEx学院仅提供信息参考,不构成任何投资建议,用户一切投资行为与本站无关。

加⼊OKEx全球社群

和全球数字资产投资者交流讨论

扫码加入OKEx社群

相关推荐

industry-frontier