复制成功

分享至

主页 > 比特币 >

“1024 直接对标 ChatGPT!”科大讯飞星火大模型立 Flag、一手实测来了

2023.05.07

作者 | 屠敏

出品 | CSDN(ID:CSDNnews)

短短半年之内,在大模型赛道上,国内外 AI 头部玩家陆续带着自己的 AIGC 产品迅速就位并“开跑”。现如今,谁能打造出中国版 ChatGPT,已经不再是一个问题。但是,谁能做出更好的中国版 ChatGPT,成为业界关注的重点。

北京时间 5 月 6 日下午 2:00,作为人工智能“国家队”的科大讯飞,如约揭晓了其认知大模型——讯飞星火的真实面纱, 并带来了丰富的应用成果,为中国生成式 AI 市场再添一位猛将。

目前,讯飞星火认知大模型已经开启内测(https://xinghuo.xfyun.cn)。CSDN 在早前已经获得了内测,下文中,我们也将与大家一起探测「讯飞星火认知大模型」的真实情况,以及它的与众不同之处。

“1024 直接对标 ChatGPT!”科大讯飞星火大模型立 Flag、一手实测来了“1024 直接对标 ChatGPT!”科大讯飞星火大模型立 Flag、一手实测来了


带着 7 大类 481 个细分的任务类型,讯飞星火认知大模型来了!


在发布会现场,科大讯飞董事长刘庆峰表示,认知大模型的技术阶跃和快速进化,让人工智能在全球掀起全新热潮。当前,认知大模型成为通用人工智能的“曙光”。与此同时,认知大模型的“智能涌现”将带来解决人类刚需的全新机遇。

具体来看,智能涌现的通用人工智能系统具有七大能力,包括文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模态能力。基于此,人类只要做画龙点睛的加工,就能得到“懂你所言,答你所问,创你所需,解你所难,学你所教”的所有内容。

“1024 直接对标 ChatGPT!”科大讯飞星火大模型立 Flag、一手实测来了

讯飞星火认知大模型是基于科大讯飞 12 年的技术积累,打造而成,实现了通用人工智能系统七大能力中的 481 个细分任务。其还在 2022 年 12 月 15 日,正式启动“1+N”认知大模型专项攻关,其中“1”就是指通用认知智能大模型,“N”就是大模型在教育、办公、汽车、人机交互等各个领域的落地。

“1024 直接对标 ChatGPT!”科大讯飞星火大模型立 Flag、一手实测来了

对于先行者,刘庆峰表示,「向 OpenAI 致敬和学习,快速追赶并努力超越」。

“1024 直接对标 ChatGPT!”科大讯飞星火大模型立 Flag、一手实测来了

与此同时,其更是在现场目标明确,立下 2023 年内讯飞星火认知大模型的升级 Flag:

  • 6 月 9 日,讯飞星火认知大模型将突破开放式问答、升级多轮对话能力、数学能力。
  • 8 月 15 日,突破代码能力、继续升级多模态交互能力。
  • 10 月 24 日,讯飞星火认知大模型将在通用大模型领域直接对标 ChatGPT,并在中文维度实现超越。
  • “1024 直接对标 ChatGPT!”科大讯飞星火大模型立 Flag、一手实测来了

    话不多说,我们也将从七大能力直接开启测试模式。

    “1024 直接对标 ChatGPT!”科大讯飞星火大模型立 Flag、一手实测来了


    代码能力:多功能、多语言


    对于程序员而言,关注的重点当然是大模型能给我们解决多少代码、编程问题。

    在此,我们便先测试一下。

    譬如,捉 Bug。

    “1024 直接对标 ChatGPT!”科大讯飞星火大模型立 Flag、一手实测来了

    写代码:“围绕“给定一个 1-100 的整数数组,请找到其中缺少的数字”写一段实现代码”。

    “1024 直接对标 ChatGPT!”科大讯飞星火大模型立 Flag、一手实测来了

    再来一个递归函数:

    “1024 直接对标 ChatGPT!”科大讯飞星火大模型立 Flag、一手实测来了

    挑战难一点的:「怎么用 C++ 编写一个复数计算器?包括加减乘除、幂次方、取模、辐角、共轭。实部和虚部都是实数范围。」

    “1024 直接对标 ChatGPT!”科大讯飞星火大模型立 Flag、一手实测来了“1024 直接对标 ChatGPT!”科大讯飞星火大模型立 Flag、一手实测来了“1024 直接对标 ChatGPT!”科大讯飞星火大模型立 Flag、一手实测来了

    对此,我们咨询了 CSDN-AI 团队研发总监对这段代码进行了点评,其表示:讯飞星火认知大模型生成的代码,复数类的代码基本实现是对的,但是测试用例没有一次性生成完整。和 GPT 生成的测试用例相比,这段代码比较简洁完整。

    其实在代码能力上,刘庆峰坦言,讯飞星火大模型的这一功能和 ChatGPT 相比,还有很大差距,下一步升级的重点功能也是这一块。

    就连大模型自身也说道:“我的代码生成功能仍然有限,可能无法满足复杂的业务需求”。

    “1024 直接对标 ChatGPT!”科大讯飞星火大模型立 Flag、一手实测来了

    免责声明:数字资产交易涉及重大风险,本资料不应作为投资决策依据,亦不应被解释为从事投资交易的建议。请确保充分了解所涉及的风险并谨慎投资。OKEx学院仅提供信息参考,不构成任何投资建议,用户一切投资行为与本站无关。

    加⼊OKEx全球社群

    和全球数字资产投资者交流讨论

    扫码加入OKEx社群

    相关推荐

    industry-frontier