ChatGPT联网功能正式上线,
百川VS智谱,谁是中国的OpenAI?
文章来源:光锥智能
文:郝鑫
编:刘雨琦
6月初,外媒曾发出了“谁是中国的OpenAI”的拷问,经历了大模型创业潮之后,大浪淘沙,最终留下的不过寥寥数人。
清华大学几个十字路口外的赛尔大厦,是明星创业者王小川的百川智能,搜狐网络大厦是学院派出身的智谱AI。二者在经历了市场的检验后,成为了最有希望的两个候选人。
两栋楼的争夺战,似乎已经悄然打响了。
从融资上看,智谱AI和百川智能都在今年,完成了多轮大额融资。
(光锥智能制图:根据公开资料整理)
今年,智谱AI累计总融资金额超25亿元人民币,百川智能总融资金额达到3.5亿美元(约23亿人民币)。公开信息显示,智谱 AI 最新估值已经超100亿人民币,最高或达150亿,是国内估值最快超过百亿人民币的公司之一;最新一轮融资后,百川智能估值已经超过10亿美金(约66亿人民币)。
从团队构成上看,智谱AI和百川智能师出同门,智谱AI总裁王绍兰与搜狗创始人王小川,同为清华系创业团队。
从技术追赶速度来看,二者也不分伯仲。智谱AI的GLM-130B刚问世就打败了GPT-3,而最新发布的Baichuan 2在各维度领先Llama 2,开拓了中国开源生态发展。
种种迹象显示,智谱AI和百川智能已经成为了中国大模型赛道冲出的“黑马”,激烈的角逐下,究竟鹿死谁手?
OpenAI的信徒:智谱AI
智谱AI与OpenAI的渊源可以追溯到2020年,那一年被智谱AI CEO张鹏视为心中真正的“AI大语言模型元年”。
智谱AI与OpenAI的渊源可以追溯到2020年,那一年被智谱AI CEO张鹏视为心中真正的“AI大语言模型元年”。
智谱AI周年庆日的当天,喜悦的空气氛围中,时不时能嗅到GPT-3出世带来的些许焦虑。达到1750亿个参数的GPT-3是严格意义上的第一个大语言模型。
彼时,张鹏既震惊于GPT-3的涌现能力,也陷入了“要不要跟随”的思考之中,不管是当时还是现在,All in超大规模参数大模型方向都是一件极其冒险的事情。权衡过后,智谱AI决定把OpenAI作为自己的对标对象,投入到超大规模预训练模型的研发当中。
(光锥智能制图:根据公开资料整理)
在技术路径选择上,智谱AI与OpenAI具有同样的独立思考性。
当时存在BERT、GPT和T5几种大模型预训练框架。三种路径,在训练目标、模型结构、训练数据来源、模型大小几方面都各有优劣。
假如把大模型训练过程比作一场英文考试,BERT擅长通过词句之间关系来做题,通过理解去考试,其复习资料主要源于课本和维基百科;GPT擅长通过预测下一个词来做题,通过大量写作练习来准备考试,其复习资料主要来自各种各样的网页;T5则采取了一种将题目形式化的策略,先把题目翻译成汉语再去解题,在复习时,不仅阅读课本,还刷了大量题库。
众所周知,谷歌选择了BERT,OpenAI选择了GPT,智谱AI没有盲目跟从,在这两种路线基础上提出了 GLM(General Language Model)算法框架。该框架实则实现了BERT、GPT优劣互补,“既能在理解的同时,还能完成续写和填空”。
GLM由此成为了智谱AI追逐OpenAI最大的底气,在此框架之下陆续长出了GLM-130B、ChatGLM-6B、ChatGLM2-6B等GLM系列大模型。实验数据显示,GLM系列大模型在语言理解精度、推理速度、内存占比和大模型适配应用方面都优于GPT。
(图源:网络)
OpenAI是当前国外能提供基础模型服务最为完备的机构,其商业化主要分为两类,一类是API调取收费,一类是ChatGPT订阅制收费。在商业化方面,智谱AI也遵循了大致的思路,处于国内大模型商业化较为成熟的企业梯队。
据光锥智能梳理发现,结合中国企业的落地情况,智谱AI的商业模式分为API调取收费和私有化收费模式。
总体提供的模型种类分别有语言大模型、超拟人大模型、向量大模型与代码大模型,在每个大模型选项下包括了标准定价、云端私有化定价和本地私有化定价。对比OpenAI,智谱AI缺乏了语音、图像大模型服务的提供,但增加了超拟人大模型,这也迎合了中国数字人、智能NPC等行业的需求。
(光锥智能制图:根据公开资料整理)
光锥智能向开发者了解到,“目前,百度文心千帆平台的特点是完善,通义千问的特点是灵活,智谱AI则是市场主流厂商中API收费最便宜的公司之一”。