中国AI今天的问题，是大模型又多又乱

2023.11.21

原文来源：脑极体

图片来源：由无界 AI生成

OpenAI的开发者日活动后，GPTs模式引发了新一轮的AI热潮，开发者调用过分火爆，甚至导致OpenAI服务器一度宕机。随后，花式把玩GPTs的经验，以及围绕这种新形态的巨大争议开始涌现。中国的IT从业者、软件开发者与AI工程师也积极参与讨论，迎来了一场新的AI狂欢。

但在这种氛围下，却有一种沉默显得像个显眼包。那就是绝大多数大模型公司，似乎都沉默了。为了模仿类GPT的大模型，中国AI圈用了一年时间，雨后春笋般打造了上百个大模型。但其中能够诞生明星应用，能够推动产品创新，甚至能够拥有规模化用户的似乎都寥寥无几。当OpenAI的飞轮效应显现，这些大模型公司就有种越是模仿差距越大的感觉。于是干脆不去追新的热点，埋头把眼前能做的先做完。

记得今年年初的时候，社交网络和媒体都在讨论中国能否有大模型？

当时我们说过，这其实是个伪命题，因为中国早就有大模型。而在ChatGPT爆火之后，中国AI遇到的问题一定不是大模型太少，而是大模型过剩。

今天，这种问题开始浮现了出来。此刻中国AI行业最大的问题，就是大模型太多，而且还挺乱。

摩肩接踵的大模型

中国到底有多少AI大模型？经过一年的井喷式发展，这已经变成了一笔糊涂账。上半年的时候，答案大概是几十个。时间来到11月，有人说是一百多个，有人说是二百多个。总之，中国此刻必然是全世界拥有大模型最多的国家，远远超过美国。

但是，这一百多个大模型有人用过吗？有人对比、评测过吗？恐怕没有。因为除了几个头部大模型形成了用户规模外，其中大部分存在于开源社区，还有一部分只存在通稿里。

这就像什么呢？其实很多人不知道，根据相关数据，中国有2600万足球人口，同样居世界第一。我们无从考证数据从何而来，反正周围踢足球的人看着是不多，而国足的成绩有目共睹。

为什么会出现这么多大模型呢？

首先是今年大模型赛道好，机会难得。虽然科技板块的VC市场非常低迷，但在其他互联网创投项目普遍失效，虚拟货币被严格限制的情况下，AI大模型成为今年近乎唯一的故事。因此即便热钱不多，但还是集中涌向了大模型创业。

其次，与很多人设想的不同，大模型创业并没有真正意义上的高门槛。一旦以股权、期权等方式吸引到了合适的人才，大模型创业公司过多的费用支出。相比于其他科技领域有产品研发、用户推广、硬件化等烧钱选项，在拥有大量开放数据集、免费工具的情况下，仅仅是训练大模型并没有过高的成本门槛，并且所谓大模型项目，往往一个科研团队就可以支撑，不需要像互联网创业公司搭建较为复杂的业务体系。

此外，还有一种“刷业绩”式的大模型，极大程度增加了大模型数量。这种一般是高校、科研机构相关团队，选报大模型方面课题更容易获得立项。其结项结果发布后，大模型数量就又增加了一个。或者是大型企业上级要求做大模型，于是IT部门会根据开源的模型框架搭建一个出来，即使效果不佳，落地困难，也要进行对内对外宣传。

赛道好、成本低、需要完成任务，这几种动力，导致中国大模型越来越多，且产生效率越来越快。

但问题在于，足球人口规模可能确实很重要，但更重要的是有一支能踢进世界杯的球队。

没有希望的窄赛道

那么有人或许要问了。大模型数量说难道不能成为优势吗？我们靠数量出奇迹，说不定数量一多就能选出拔尖的来？

这恐怕并不现实。因为从种种理由来看，今天庞大的大模型规模，都是不可能持续存在。通稿打造类GPT模型而挤入下一个科技时代的美好想法，已经将AI大模型变成了一条没有希望的窄赛道。

我们可以来正视这样几个问题：

1.大模型的数量多，其实和大模型本质背道而驰。

提起大模型，我们会说它的优点是模型的泛化性、高鲁棒性，继而带来了“智能涌现”效果。我们总是惊叹OpenAI的成绩，就是因为GPT系列始终在深度挖掘模型的泛化性。也就是说，大模型的优势就是一个顶一群，用一个模型代替一堆模型，结果反而出现了数量过剩的大模型，这与大模型初衷南辕北辙，并且浪费了海量的社会资源。

2.大模型是底层技术，底层技术的玩家不可能很多。

中国AI今天的问题，是大模型又多又乱

加⼊OKEx全球社群

相关推荐