复制成功

分享至

主页 > 比特币 >

清华系ChatGLM3现场怼脸演示!多模态直逼GPT-4V,国产Code Interpreter来了

2023.10.28

原文来源:新智元

清华系ChatGLM3现场怼脸演示!多模态直逼GPT-4V,国产Code Interpreter来了

图片来源:由无界 AI生成

全自研第三代基座大模型ChatGLM3,今日推出!

这是继6月份二代模型推出以来,智谱AI团队又一次对ChatGLM基座模型的优化。

此外,在10月27日的2023中国计算机大会(CNCC)上,智谱AI还开源了ChatGLM3-6B(32k)、多模态CogVLM-17B、以及智能体AgentLM。

ChatGLM3系列模型发布后,智谱成为国内唯一一个有对标OpenAI全模型产品线的公司。

清华系ChatGLM3现场怼脸演示!多模态直逼GPT-4V,国产Code Interpreter来了

生成式AI助手智谱清言,也成为国内首个具备代码交互能力的大模型产品。

模型全自研,适配国产芯片,性能更强大,开源生态更开放。

作为最早入局大模型研究的企业,智谱AI率先交卷!

而且,智谱AI今年已累计完成超25亿人民币融资,美团、蚂蚁、阿里、腾讯……豪华的投资方名单,无不显出业内对智谱AI的强烈信心。


瞄向GPT-4V的技术升级


当前,多模态视觉模型GPT-4V已经展现出强大的识图能力。

与此同时,瞄向GPT-4V,智谱AI这次也对ChatGLM3其他的能力,进行了迭代升级。其中包括,多模态理解能力的模型CogVLM,能够试图理解,刷新了10+个国际标准图文评测数据集SOTA。目前,CogVLM-17B已开源。

代码增强模块Code Interpreter能根据用户需求生成代码并执行,自动完成数据分析、文件处理等复杂任务。

网络搜索增强WebGLM,通过接入搜索增强,能自动根据问题在互联网上查找相关资料,并在回答时提供参考相关文献或文章链接。

另外,ChatGLM3的语义能力与逻辑能力也大大增强。

6B版本直接开源

值得一提的是,ChatGLM3一经发布,智谱AI直接向社区开源了6B参数的模型。

评测结果显示,与ChatGLM 2相比,以及国内同尺寸模型相比,ChatGLM3-6B在44个中英文公开数据集测试中,9个榜单中位列第一。

分别在MMLU提升36%、CEval提升33%、GSM8K提升179%、BBH提升126%。

其开源的32k版本ChatGLM3-6B-32K在LongBench中表现最佳。

另外,正是采用了最新的「高效动态推理+显存优化技术」,使得当前的推理框架在相同硬件、模型条件下,更加高效。

相较于目前最佳的开源实现,对比伯克利大学推出的vLLM,以及Hugging Face TGI的最新版本,推理速度提升了2-3倍,推理成本降低1倍,每千tokens仅0.5分,成本最低。

自研AgentTuning,智能体能力激活

更令人惊喜的是,ChatGLM3也带了全新的Agent智能体能力。

智谱AI希望,大模型能够通过API与外部工具更好交流,甚至通过智能体实现大模型交互。

通过集成自研的AgentTuning技术,能够激活模型智能代理能力,尤其在智能规划和执行方面,相比于ChatGLM 2提升1000%。

在最新的AgentBench上,ChatGLM3-turbo已经和GPT-3.5接近。

与此同时,智能体AgentLM也向开源社区开放。智谱AI团队希望的是,让开源模型达到甚至超过闭源模型的Agent能力。

这意味着,Agent智能体将开启国产大模型原生支持「工具调用、代码执行、游戏、数据库操作、知识图谱搜索与推理、操作系统」等复杂场景。

1.5B/3B同时发布,手机就能跑

想用手机去跑ChatGLM?可以!

这次ChatGLM3还专门推出了可在手机端部署的端测模型,分别有两个参数:1.5B和3B。

它能够支持Vivo、小米、三星在内的多种手机以及车载平台,甚至支持移动平台上CPU芯片的推理,速度可达20 tokens/s。

精度方面,1.5B和3B模型在公开基准评测上,性能直逼ChatGLM2-6B模型,快去试试!

清华系ChatGLM3现场怼脸演示!多模态直逼GPT-4V,国产Code Interpreter来了


新一代「智谱清言」全面上线


正如ChatGPT背后有个强大的GPT-4模型,智谱AI团队的生成式AI助手「智谱清言」也得到了ChatGLM3的加持。

这个团队直播演示完,功能直接就上线了,主打的就是一个真诚!

测试地址:https://chatglm.cn/main/detail

代码解释器

作为ChatGPT最受欢迎的插件之一,Advanced Data Analysis(原Code Interpreter)可以根据自然语言输入,以更加数学的思维分析问题,并同时生成恰当的代码。

如今,在全新升级的ChatGLM3加持下,「智谱清言」已成为国内首个具备Advanced Data Analysis能力的大模型产品,可支持图像处理、数学计算、数据分析等使用场景。

理工男的浪漫,或许只有「智谱清言」能懂。

虽然CEO张鹏现场表演画「红心」翻车,不过换个prompt一试,结果秒出。

清华系ChatGLM3现场怼脸演示!多模态直逼GPT-4V,国产Code Interpreter来了

同样,升级后的ChatGLM3在数据分析方面也十分拿手。

清华系ChatGLM3现场怼脸演示!多模态直逼GPT-4V,国产Code Interpreter来了

在一番解析之后,即可根据字段prompt的长度,画出长度分布的直方图。

清华系ChatGLM3现场怼脸演示!多模态直逼GPT-4V,国产Code Interpreter来了

搜索增强

随着WebGLM大模型能力的加入,「智谱清言」现在也具有了搜索增强的能力——可以根据网上的最新资料总结出问题回答,并附上参考链接。

比如,最近iPhone 15迎来了一波降价,具体波动幅度有多大?

「智谱清言」给出的答案,效果还不错!

清华系ChatGLM3现场怼脸演示!多模态直逼GPT-4V,国产Code Interpreter来了

图文理解

CogVLM模型则提高了智谱清言的中文图文理解能力,取得了接近GPT-4V的图片理解能力。

它可以回答各种类型的视觉问题,并且可以完成复杂的目标检测,并打上标签,完成自动数据标注。

免责声明:数字资产交易涉及重大风险,本资料不应作为投资决策依据,亦不应被解释为从事投资交易的建议。请确保充分了解所涉及的风险并谨慎投资。OKEx学院仅提供信息参考,不构成任何投资建议,用户一切投资行为与本站无关。

加⼊OKEx全球社群

和全球数字资产投资者交流讨论

扫码加入OKEx社群

相关推荐

industry-frontier