巴比特 | 元宇宙每日必读
“1024 直接对标 ChatGPT!”科大讯飞星火大模型立 Flag、一手实测来了
作者 | 屠敏
出品 | CSDN(ID:CSDNnews)
短短半年之内,在大模型赛道上,国内外 AI 头部玩家陆续带着自己的 AIGC 产品迅速就位并“开跑”。现如今,谁能打造出中国版 ChatGPT,已经不再是一个问题。但是,谁能做出更好的中国版 ChatGPT,成为业界关注的重点。
北京时间 5 月 6 日下午 2:00,作为人工智能“国家队”的科大讯飞,如约揭晓了其认知大模型——讯飞星火的真实面纱, 并带来了丰富的应用成果,为中国生成式 AI 市场再添一位猛将。
目前,讯飞星火认知大模型已经开启内测(https://xinghuo.xfyun.cn)。CSDN 在早前已经获得了内测,下文中,我们也将与大家一起探测「讯飞星火认知大模型」的真实情况,以及它的与众不同之处。
带着 7 大类 481 个细分的任务类型,讯飞星火认知大模型来了!
在发布会现场,科大讯飞董事长刘庆峰表示,认知大模型的技术阶跃和快速进化,让人工智能在全球掀起全新热潮。当前,认知大模型成为通用人工智能的“曙光”。与此同时,认知大模型的“智能涌现”将带来解决人类刚需的全新机遇。
具体来看,智能涌现的通用人工智能系统具有七大能力,包括文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模态能力。基于此,人类只要做画龙点睛的加工,就能得到“懂你所言,答你所问,创你所需,解你所难,学你所教”的所有内容。
讯飞星火认知大模型是基于科大讯飞 12 年的技术积累,打造而成,实现了通用人工智能系统七大能力中的 481 个细分任务。其还在 2022 年 12 月 15 日,正式启动“1+N”认知大模型专项攻关,其中“1”就是指通用认知智能大模型,“N”就是大模型在教育、办公、汽车、人机交互等各个领域的落地。
对于先行者,刘庆峰表示,「向 OpenAI 致敬和学习,快速追赶并努力超越」。
与此同时,其更是在现场目标明确,立下 2023 年内讯飞星火认知大模型的升级 Flag:
话不多说,我们也将从七大能力直接开启测试模式。
代码能力:多功能、多语言
对于程序员而言,关注的重点当然是大模型能给我们解决多少代码、编程问题。
在此,我们便先测试一下。
譬如,捉 Bug。
写代码:“围绕“给定一个 1-100 的整数数组,请找到其中缺少的数字”写一段实现代码”。
再来一个递归函数:
挑战难一点的:「怎么用 C++ 编写一个复数计算器?包括加减乘除、幂次方、取模、辐角、共轭。实部和虚部都是实数范围。」
对此,我们咨询了 CSDN-AI 团队研发总监对这段代码进行了点评,其表示:讯飞星火认知大模型生成的代码,复数类的代码基本实现是对的,但是测试用例没有一次性生成完整。和 GPT 生成的测试用例相比,这段代码比较简洁完整。
其实在代码能力上,刘庆峰坦言,讯飞星火大模型的这一功能和 ChatGPT 相比,还有很大差距,下一步升级的重点功能也是这一块。
就连大模型自身也说道:“我的代码生成功能仍然有限,可能无法满足复杂的业务需求”。