DeepMind指出「Transformer无法
对话智谱 AI CEO 张鹏:AI Agent 是重要新风向,大模型竞争已步入混战后期
原文来源:极客公园
作者:连冉
图片来源:由无界 AI生成
相似的技术路线、商业策略以及愿景,智谱 AI 一度被称为最有 OpenAI 气质的中国公司。
作为首批网信办批准向公众提供大模型产品服务的公司之一,在近期完成 B-4 轮 融资后,智谱 AI 已经累计获得超 25 亿元融资,成为 AI 赛道备受瞩目的独角兽。如今,智谱 AI 的团队有 400 余人,其中七成是研发人员,同时,核心团队还新增了「智谱首席生态官」刘江——这位前智源研究院副院长,同时也是光年之外曾经的核心成员。
10 月 27 日,智谱 AI 在 2023 中国计算机大会(CNCC)上发布了新一代的瞄准 GPT-4V 的中英双语对话模型 ChatGLM3 、国内首个具备代码交互能力的大模型产品「智谱清言」,并在其 MaaS 平台「智谱 AI 开放平台」推出了新的商用部署方案:ChatGLM-turbo 版本,其 API 价格相较于直接部署 ChatGLM 降低了 50%。
考虑到 OpenAI 在技术上的领先性,智谱 AI 在产品研发上还是与其有相似之处。此次 ChatGLM 3 系列模型发布后,智谱 AI 更是成为了目前国内唯一一个有对标 OpenAI 全模型产品线的公司。
智谱 AI 对标 OpenAI 全模型产品线
在新模型发布后,智谱 AI CEO 张鹏和极客公园聊了聊他们的近况和一些行业认知。谈到与 ChatGLM2 相比,智谱 AI 此次瞄准 GPT-4V 推出的 ChatGLM 3 性能更加强大,接入了具有多模态理解能力的模型 CogVLM、代码增强模块 Code Interpreter、网络搜索增强模型 WebGLM,并增强了语义理解和逻辑理解能力,实现了若干功能的迭代升级。
智谱 AI CEO 张鹏
至于行业格局,在张鹏看来,「模型侧已进入混战的后期,格局会慢慢地清晰下来」。
以下为对话全文。
01 AI Agent 新风向
极客公园:这次发布的新模型在性能表现上主要有哪些提升?
张鹏:10 月 28 日发布的内容其实之前已经分批次放出来了,只是没有特别正式地向外界表示。提升的话,最关键的是整体上的性能提升。因为我们每一代模型相比上一代都会有一个阶梯式的性能提升,提升程度的话,最低也会有 Benchmark 上百分之十几的提升。按规律来说,这种上升曲线是会趋平的,因为越往后提升会越小。
但我们三代相对于二代的提升,比二代相对于一代的提升其实更大,这个是挺难做到的一件事情。这一点上我们也确实花了很多时间和精力,效果也非常的不错。然后性能的提升其实也涉及到工程的效率问题,这个就跟商业化有关系了。
真正商业化的时候无非就考虑几件事,第一个是成本,第二个是收益,价格和成本之间就是利润空间,所以控制成本也非常的关键,这个是可以帮助你去扩大利润空间的一个很重要的因素。所以说,推理效率提升了,我们成本也会降低,用户体验感也会更好。
这次我们还把智能体的能力提升也融合到了新一代技术里面。智能体它是基于底座的能力和一些特定的能力,去让模型能够帮助人去解决更复杂的需求和更复杂的问题的一项技术,它的能力是比较面向应用的。
就像一个人一样,如果他只会回答问题,就算他的知识再多,他的回答问题再完整、再精确,他也只是一个问答机器。如果它不能做,不能利用别的东西,去完成一件复杂任务,那么它的能力始终有限,所以在这一点上来说,我们也自研了一些技术,包括怎么让一个模型的智能体的能力大幅度提升。
极客公园:围绕 AI Agent(智能体)的这种新风向,后续还会产生一些什么新的行业机会?
张鹏:AI Agent(智能体)的应用非常有空间和前景。原来模型的能力大多数都是对标 ChatGPT 那种对话式的,它不能做一些复杂的事情,只能回答问题,如何扩展它的能力?之前想过很多招,比如说 Plug-in platform 其实就是在扩展模型的能力,让它能够和现有的这些外界的系统去对齐,能够去很自然、自动地去对接。那么 AI Agent 的这个能力其实是把这些东西都融合到一起,从模型层面来实现复杂任务的拆解,像人一样进行规划。
比如我有 plan A、plan B、plan C,plan A 我要分为 step one,step two,step three,一步一步的去执行。step one,我可能要去 call 一个外面系统的数据库,step two,可能我要去做数学的一个计算,step three,可能我们需要去把这个计算的结果用一个自然语言去 wrap 一下,形成一个输出,或者是形成一个表格,它是会有这样的一些能力,来解决这些问题。
极客公园:那怎么看待 AI Agent 的未来?